LeVanLoi miscellaneous articles

  1. Trang chủ
  2. Lưu
  3. Thẻ
  4. Hỏi - Đáp

 
 
LeVanLoi'log, ⌚ 2024-11-08
***
What is maximum likelihood in theory of probability?
Tác giả: Lê Văn Lợi tổng hợp

English:

In probability theory and statistics, maximum likelihood estimation (MLE) is a method used to estimate the parameters of a statistical model. The goal of MLE is to find the values of the parameters that make the observed data most probable under the assumed model.

Definition of Maximum Likelihood

Given a set of observed data points and a probability model with parameters θtheta, the likelihood function L(θ)L(theta) represents the probability of the observed data given the parameters θtheta:

L(θ)=p(dataθ)L(theta) = p(text{data} | theta)

The maximum likelihood estimator θ^hat{theta} is the value of θtheta that maximizes this likelihood function:

θ^=argmaxθL(θ)hat{theta} = arg max_{theta} L(theta)

This means θ^hat{theta} is chosen so that the observed data is as likely as possible under the model.

Key Concepts in Maximum Likelihood Estimation (MLE)

  1. Likelihood Function: The function that expresses how likely it is to observe the data for different parameter values.
  2. Log-Likelihood: It is often more convenient to work with the logarithm of the likelihood function (log-likelihood), which turns the product of probabilities into a sum and simplifies calculations, especially in cases with large data sets.
  3. Optimization: MLE involves finding the maximum of the likelihood (or log-likelihood) function, which may require optimization techniques, such as gradient ascent or numerical methods.

Example of Maximum Likelihood Estimation

For example, if we assume a set of data follows a normal distribution with mean μmu and variance σ2sigma^2, the MLE would involve finding the values of μmu and σ2sigma^2 that make the observed data most likely. For this case, μmu is estimated as the sample mean, and σ2sigma^2 as the sample variance.

Applications of Maximum Likelihood

MLE is widely used in statistics, machine learning, and econometrics for parameter estimation, model fitting, and making inferences about population parameters from sample data.

---

Vietnamese:

Trong lý thuyết xác suất và thống kê, ước lượng hợp lý cực đại (maximum likelihood estimation - MLE) là một phương pháp được sử dụng để ước lượng các tham số của một mô hình thống kê. Mục tiêu của MLE là tìm các giá trị của các tham số sao cho dữ liệu quan sát được có xác suất cao nhất dưới mô hình giả định.

Định nghĩa của Ước lượng Hợp lý Cực đại

Cho một tập hợp các điểm dữ liệu quan sát được và một mô hình xác suất với các tham số θtheta, hàm likelihood L(θ)L(theta) biểu diễn xác suất của dữ liệu quan sát được khi biết các tham số θtheta:

L(θ)=p(dataθ)L(theta) = p(text{data} | theta)

Ước lượng hợp lý cực đại θ^hat{theta} là giá trị của θtheta tối đa hóa hàm likelihood này:

θ^=argmaxθL(θ)hat{theta} = arg max_{theta} L(theta)

Điều này có nghĩa là θ^hat{theta} được chọn sao cho dữ liệu quan sát được có xác suất lớn nhất dưới mô hình đã chọn.

Các Khái niệm Chính trong Ước lượng Hợp lý Cực đại (MLE)

  1. Hàm Likelihood: Hàm thể hiện khả năng quan sát được dữ liệu cho các giá trị tham số khác nhau.
  2. Log-Likelihood: Thường thuận tiện hơn khi làm việc với logarithm của hàm likelihood (log-likelihood), giúp biến tích các xác suất thành tổng và đơn giản hóa các phép tính, đặc biệt trong trường hợp có tập dữ liệu lớn.
  3. Tối ưu hóa: MLE bao gồm việc tìm giá trị cực đại của hàm likelihood (hoặc log-likelihood), có thể yêu cầu các kỹ thuật tối ưu hóa, như gradient ascent hoặc các phương pháp số học.

Ví dụ về Ước lượng Hợp lý Cực đại

Chẳng hạn, nếu chúng ta giả định rằng một tập dữ liệu tuân theo phân phối chuẩn với trung bình μmu và phương sai σ2sigma^2, thì MLE sẽ tìm các giá trị của μmu và σ2sigma^2 để làm cho dữ liệu quan sát được có xác suất cao nhất. Trong trường hợp này, μmu được ước lượng là trung bình mẫu và σ2sigma^2 là phương sai mẫu.

Ứng dụng của Ước lượng Hợp lý Cực đại

MLE được sử dụng rộng rãi trong thống kê, học máy và kinh tế lượng để ước lượng tham số, hiệu chỉnh mô hình và suy luận về các tham số của quần thể từ dữ liệu mẫu.