LeVanLoi miscellaneous articles

  1. Trang chủ
  2. Lưu
  3. Thẻ
  4. Hỏi - Đáp

 
 
LeVanLoi'log, ⌚ 2024-11-06
***
What is marginal likelihood in theory of probability?
Tác giả: Lê Văn Lợi tổng hợp

English:

In probability theory and statistics, the marginal likelihood (also known as the evidence) is the probability of observing the given data under a particular model, integrating over all possible values of the model parameters. It is used to compare models and can be expressed as:

p(datamodel)=p(dataθ)p(θ)dθp(text{data} | text{model}) = int p(text{data} | theta) p(theta) , dtheta

where:

  • p(dataθ)p(text{data} | theta) is the likelihood of the data given specific parameter values θtheta,
  • p(θ)p(theta) is the prior distribution of the parameters,
  • dθdtheta indicates integrating over all possible values of θtheta.

Key Concepts of Marginal Likelihood

  1. Model Comparison: Marginal likelihood is often used in Bayesian model comparison to determine which model best explains the data by comparing the evidence for each model.
  2. Bayesian Inference: In Bayesian inference, the marginal likelihood is the denominator in Bayes’ theorem. It normalizes the posterior distribution to ensure it sums to one.
  3. Computational Challenges: Calculating the marginal likelihood can be complex and computationally intensive, especially in high-dimensional parameter spaces. Techniques like Markov Chain Monte Carlo (MCMC) and variational inference are often used to approximate it.

Example Usage

In Bayesian model comparison, two models, M1M_1 and M2M_2, with respective marginal likelihoods p(dataM1)p(text{data} | M_1) and p(dataM2)p(text{data} | M_2), can be compared by their ratio (Bayes factor) to evaluate which model is more likely given the observed data.

---

Vietnamese:

Trong lý thuyết xác suất và thống kê, marginal likelihood (hay còn gọi là bằng chứng) là xác suất quan sát dữ liệu đã cho theo một mô hình cụ thể, khi đã tích phân qua tất cả các giá trị khả dĩ của các tham số của mô hình. Nó được sử dụng để so sánh các mô hình và có thể được biểu diễn như sau:

p(datamodel)=p(dataθ)p(θ)dθp(text{data} | text{model}) = int p(text{data} | theta) p(theta) , dtheta

trong đó:

  • p(dataθ)p(text{data} | theta) là likelihood của dữ liệu khi biết các giá trị tham số cụ thể θtheta,
  • p(θ)p(theta) là phân phối tiên nghiệm của các tham số,
  • dθdtheta biểu thị việc tích phân qua tất cả các giá trị khả dĩ của θtheta.

Các Khái Niệm Chính về Marginal Likelihood

  1. So sánh mô hình: Marginal likelihood thường được dùng trong so sánh mô hình Bayes để xác định mô hình nào giải thích dữ liệu tốt nhất bằng cách so sánh bằng chứng cho từng mô hình.
  2. Suy luận Bayes: Trong suy luận Bayes, marginal likelihood là mẫu số trong định lý Bayes, đóng vai trò chuẩn hóa phân phối hậu nghiệm để đảm bảo tổng của nó bằng một.
  3. Thách thức tính toán: Việc tính toán marginal likelihood có thể phức tạp và tốn kém về tính toán, đặc biệt trong các không gian tham số có chiều cao. Các kỹ thuật như Markov Chain Monte Carlo (MCMC) và suy luận biến phân thường được sử dụng để xấp xỉ giá trị này.

Ví dụ về Ứng dụng

Trong so sánh mô hình Bayes, hai mô hình M1M_1 và M2M_2 với marginal likelihood tương ứng là p(dataM1)p(text{data} | M_1) và p(dataM2)p(text{data} | M_2) có thể được so sánh bằng tỷ lệ của chúng (Bayes factor) để đánh giá mô hình nào có khả năng giải thích dữ liệu tốt hơn.