Tin kinh tế, tài chính, đầu tư, chứng khoán,tiêu dùng

Đừng gây oan sai với xác suất

Minh họa: Khều.

Vì những sai lầm sơ đẳng về cách hiểu và tính toán các con số thống kê, nhiều người vô tội đã bị kết án, và đôi khi hệ quả rất bi thảm cho người bị kết án sai.

Trường hợp Sally Clark

Một trong những kết cục bi thảm do hiểu sai thống kê và kết án sai là trường hợp của bà Sally Clark. Bà là một luật sư, xuất thân từ một gia đình trung lưu ở Anh. Bà hạ sinh hai người con trai, nhưng cả hai đều chết một cách đột ngột sau khi sinh. Đứa con đầu lòng chết lúc 11 tuần tuổi (1996). Đứa con thứ hai chết lúc 8 tuần sau khi sinh (1997). Cả hai đều không rõ nguyên nhân. Trong y văn, những trường hợp này được gọi là “hội chứng đột tử” (SIDS - sudden infant death syndrome).

Ngay sau khi người con trai thứ hai chết, bà Clark bị cảnh sát bắt, hầu tòa, và bị kết tội giết con, bởi vì theo một chuyên gia y khoa, xác suất mà hai người con chết một cách ngẫu nhiên trong một gia đình trung lưu như thế là chỉ 1/73 triệu. Nói cách khác, theo chuyên gia này, xác suất hai trẻ chết trong gia đình không do yếu tố ngẫu nhiên là rất cao (hàm ý cố sát) và do đó ông đã thuyết phục bồi thẩm đoàn kết án bà Clark.

Con số xác suất (1/73 triệu) nổi tiếng đó là “tác phẩm” của giáo sư nhi khoa Roy Meadow, người làm nhân chứng chuyên gia trong phiên tòa kết tội Sally Clark. GS. Meadow có nhiều công trình nghiên cứu về hội chứng đột tử, và cũng chính là cha đẻ của hội chứng “Munchausen syndrome by proxy” (có nghĩa là hội chứng tâm lý mà cha mẹ có ý gây tổn thương cho con cái để được chú ý). Ông còn là một người đấu tranh chống lạm dụng trẻ em, và là tác giả của cuốn sách “The ABC of Child Abuse”. Do đó, “bằng chứng” của ông mang tính thuyết phục khá cao đối với bồi thẩm đoàn.

Cho đến nay, nguyên nhân của đột tử vẫn chưa rõ ràng, nhưng yếu tố môi trường và di truyền được xem là quan trọng. Giới y tế biết được 3 yếu tố có thể làm tăng nguy cơ đột tử: (i) mẹ dưới 27 tuổi; (ii) có người hút thuốc lá trong nhà; và (iii) gia đình thuộc diện nghèo khó. Nếu gia đình không có bất cứ yếu tố nguy cơ nào thì xác suất đột tử là 1/8.543; gia đình có một yếu tố nguy cơ thì xác suất tăng lên 1/1.616; 2 yếu tố nguy cơ: 1/596; và 3 yếu tố nguy cơ thì xác suất đột tử là 1/214.

Gia đình của Sally Clark không có yếu tố nguy cơ nào. Do đó, GS. Meadow lý giải rằng xác suất đột tử trong một gia đình trung lưu như Clark là khoảng 1/8.543. Ông lý giải tiếp rằng nếu 2 trẻ cùng chết trong một gia đình thì xác suất là 1/8.543 x 1/8.543 và kết quả là khoảng 1/73 triệu.

Nói cách khác, ông cho rằng xác suất Sally Clark có tội là 1 trừ cho 1/73.000.000 = 0.99999999999 (tức bằng 1 hay 100%). Khi tòa án hỏi gợi ý tư vấn một chuyên gia về thống kê, thì cả công tố viên và GS. Meadow đều nói rằng đây không phải là “rocket science” (ý nói vấn đề đơn giản) nên không cần đến chuyên gia thống kê. Họ tự tin rằng họ thành thạo về thống kê và xác suất. Tòa án kết án bà Sally Clark phạm tội giết người, và phạt tù chung thân.

Khi sự việc được báo chí tường thuật, các nhà thống kê học bắt đầu chú ý, và họ chỉ ra hai sai lầm cực kỳ sơ đẳng nhưng rất tai hại trong lý giải của GS. Meadow.

Sai lầm thứ nhất là ông giả định rằng xác suất 2 trẻ em chết trong một gia đình độc lập với nhau (nên nhân 2 xác suất với nhau). Giả định này sai, vì đột tử có thể có nguyên nhân từ môi trường và di truyền, mà hai em là anh em, tức có thể có cùng gen và cùng mẹ (cùng môi trường) nên 2 hiện tượng không thể độc lập. Thật ra, nếu 1 trẻ bị đột tử thì xác suất trẻ thứ 2 bị đột tử rất cao. Theo phân tích của GS. Ray Hill (một chuyên gia về thống kê), nếu gia đình đã có một bé đột tử, thì xác suất đột tử của bé thứ hai tăng 10-22 lần. Nói tóm lại, cách tính của GS. Meadow (nhân 2 xác suất) là hoàn toàn sai lầm.

Sai lầm thứ hai là GS. Meadow lẫn lộn giữa xác suất bà Sally Clark giết con với xác suất trùng hợp về đột tử. Xác suất mà GS. Meadow tính toán là xác suất trùng hợp, tức là xác suất mà hai ca đột tử xảy ra một cách ngẫu nhiên. Nhưng câu trả lời mà người ta cần biết là với dữ liệu nghiên cứu có được, xác suất bà Clark sát hại con là bao nhiêu. Tiến sĩ Helen Joyce áp dụng Định lý Bayes với kết quả cho thấy xác suất đứa trẻ thứ hai tử vong vì “nguyên nhân tự nhiên” (không phải cố sát) là 62,5%.

Ngày 29-1-2003, sau khi luật sư của bà Sally Clark kháng án, với nhân chứng mới từ một giáo sư thống kê học, tòa án tuyên bố Sally Clark vô tội. Tòa án cũng khiển trách GS. Meadow vì đưa bằng chứng sai. Hội đồng y khoa Anh kỷ luật GS. Meadow, tước chức danh, và cấm hành nghề thầy thuốc. Tuy nhiên, sau này, ông kháng án, và được cho hành nghề thầy thuốc, nhưng uy tín thì bị tổn hại nghiêm trọng. Phần bà Sally Clark, sau khi được trả tự do vài năm, bà qua đời vào tháng 3-2007, thọ 42 tuổi.

Trường hợp Lucia de Berk

Một trường hợp diễn giải sai lầm ý nghĩa của xác suất cũng dẫn đến án tù cho một y tá ở Hà Lan. Tháng 3-2003, Lucia de Berk bị cảnh sát Hà Lan truy tố vì tội giết người và tội cố sát.

Thoạt đầu, chứng cứ trình bày trước tòa có vẻ thuyết phục. Cảnh sát điều tra cho biết có bảy bệnh nhân trong bệnh viện Juliana đột ngột tử vong trong thời gian bà de Berk làm việc (1999-2001), và những trường hợp tử vong này xảy ra hoặc là gần, hoặc là ngay tại khu điều trị de Berk phục vụ.

Ngoài ra, de Berk có mặt tại hiện trường trong hầu hết những trường hợp tử vong xảy ra.

Ngoài bối cảnh câu chuyện, không có thêm chứng cứ bằng hiện vật nào chứng minh de Berk có liên can đến các trường hợp tử vong. Ngay cả khi bốc mộ để phân tích DNA, người ta cũng không thấy dấu vết nào liên quan đến de Berk. Tuy nhiên, dựa vào tính toán của luật sư và nhà thống kê tài tử, tòa kết án de Berk tội giết người và cố sát, với án phạt tù chung thân.

Henk Elffers, giáo sư luật và là một nhà thống kê học tài tử, tính toán rằng xác suất mà de Berk hiện diện một cách ngẫu nhiên trong các trường hợp tử vong như thế là 1/342 triệu. Dựa vào “chứng cứ” này, tòa án Hà Lan kết tội de Berk giết người và cố sát, và phạt tù chung thân. De Berk bị dư luận công chúng và báo chí cho là một kẻ giết người hàng loạt. Riêng de Berk trước sau vẫn tiếp tục kêu oan.

Nhưng nhà toán học Richard Gill cho rằng tòa án đã phạm phải sai lầm nghiêm trọng. Con số 1/342 triệu là hoàn toàn sai, vì dữ liệu tính toán Elffers thu thập là từ khu điều trị của bệnh viện mà de Berk phục vụ, chứ không thu thập thêm dữ liệu ở các bệnh viện khác để so sánh.

Thêm vào đó, cách tính của Giáo sư Elffers là chẳng những cực kì vô lý, mà còn… hài hước: không một ai học thống kê mà nhân hai trị số P và đi đến một kết luận. Cách tính của Elffers cho thấy ông ta chẳng biết gì về thống kê và xác suất. Qua phân tích lại dữ liệu, GS. Gill ước tính rằng “xác suất tình cờ” (trong trường hợp de Berk xuất hiện tại hiện trường) là 1/48, thậm chí 1/5, chứ nhất định không thể nào 1/342 triệu.

Một sự kiện quan trọng khác mà tòa án không xem xét đến là trước khi de Berk về làm việc tại bệnh viện Juliana, đã có bảy trường hợp đột ngột tử vong cũng ngay hoặc gần khu điều trị mà de Berk làm việc. Trong thời gian de Berk làm việc (1999-2001) có thêm bảy ca tử vong. Sau khi bị các chuyên gia chỉ ra những sai lầm trong cách tính, một ủy ban đặc nhiệm đã được tòa án thành lập để thẩm định lại bản án. Các chuyên gia gồm các bác sĩ và các nhà thống kê học cũng vận động kháng án cho de Berk. Đến năm 2008, bà được tạm trả tự do, chờ điều tra tiếp.

Ngày 14-4-2010, một phiên tòa phúc thẩm đã xem xét lại bằng chứng và lý giải của các chuyên gia, tòa bác bỏ bản án cũ, và tuyên bố bà de Berk vô tội. Công tố viện Hà Lan phải xin lỗi bà. Các luật sư của bà đang “bận rộn” đòi bồi thường cho thân chủ họ.

Học xác suất!

Hai lĩnh vực luật và thống kê có một số điểm tương đồng, nhưng cũng có điểm khác nhau quan trọng. Cả hai chuyên môn đều liên quan đến việc thu thập dữ liệu hay bằng chứng, xác định ý nghĩa của dữ liệu, và đi đến kết luận dựa vào dữ liệu và logic. Tuy cả hai nhà thống kê học và luật sư đều có nhiệm vụ cung cấp tư vấn cho khách hàng, nhưng nhà thống kê học trình bày thông tin một cách khách quan không thiên vị ai (theo nguyên tắc khoa học), còn luật sư còn có vai trò biện minh cho khách hàng của mình và do đó họ trình bày thông tin thiếu tính khách quan.

Trong khi giới luật sư và tòa án đòi hỏi một câu trả lời “có” hoặc “không”, “đúng” hay “sai”, thì giới khoa học như nhà thống kê học không bao giờ phát biểu khẳng định. Đối với khoa học, phương pháp khoa học và thống kê chẳng chứng minh một giả thuyết nào cả; mà chỉ có dữ liệu có nhất quán với giả thuyết hay không mà thôi, và ngay cả kết luận nhất quán cũng kèm theo một số điều kiện và giả định. Mà, trong thực tế, nhiều khi chúng ta không biết được giả định đúng hay sai. Do đó, tuy hai ngành nghề đều thu thập bằng chứng, nhưng cách trình bày và diễn giải bằng chứng thì rất khác nhau.

Đối với khoa học thống kê, bất định là một quy luật hơn là một ngoại lệ, và đây chính là điểm mâu thuẫn với tòa án. Trong bất cứ lĩnh vực hoạt động nào của xã hội, trong cái nhìn của khoa học đều có yếu tố bất định. Mỗi quyết định của con người, dù là chánh án tối cao, đều có khả năng sai lầm. Mỗi hành động dù được thực hiện với ý định tốt nhưng đều có khả năng gây tác hại. Ngược lại, đối với tòa án, bất định là điều khó chấp nhận, bởi vì phán quyết của tòa án là xác định. Chính vì ảo tưởng xác định nên trong quá khứ tòa án và luật pháp đã phạm phải nhiều sai lầm, và sai lầm của họ dẫn đến nhiều tai họa cho nạn nhân, cho người vô tội.

Về ý nghĩa của xác suất, có hai cách hiểu cơ bản. Cách hiểu thứ nhất là xác suất là một tần số về lâu về dài. Nói xác suất sai lầm 1% có thể hiểu rằng trong 100 quyết định tương tự về lâu về dài sẽ có 1 quyết định sai. Ở đây, cái mâu thuẫn cơ bản của việc ứng dụng xác suất trong luật pháp là xác suất là con số được ước tính từ một quần thể với tử số nhỏ hơn mẫu số, còn quyết định của tòa án thường cho một cá nhân. Một cá nhân thì không có mẫu số. Do đó, nhìn như thế để thấy cách hiểu về xác suất theo ý nghĩa tần số không có giá trị cho tòa án.

Cách hiểu thứ hai về xác suất là một thước đo về khả năng, về mức độ tin cậy, hay một thước đo về tình trạng kiến thức. Nói xác suất ông Obama thắng cử 90% có nghĩa là theo cảm nhận cá nhân rằng ông ấy có khả năng thắng cử cao hơn là thất cử.

Trong thực tế, chúng ta chẳng bao giờ chứng minh được điều gì 100% (xác định); chúng ta chỉ có thể thu thập chứng cứ, dữ liệu để tăng khả năng phán quyết đúng càng cao càng tốt. Nhưng như trường hợp của Lucia de Berk và Sally Clark cho thấy, vấn đề không phải là dữ liệu, mà là phương pháp thu thập và phân tích dữ liệu sao cho phù hợp với nguyên lý khoa học và logic.

(Theo kinhtesaigon)

  • Nhân viên Nhà Trắng nhận lương bao nhiêu?
  • Những “thiên đường thuế” hàng đầu thế giới
  • Khi các ông nghị đòi tăng bổng lộc
  • IBM: 70% CFO ở ASEAN làm việc thủ công
  • 'CEO lương càng cao, doanh nghiệp càng bần tiện'
  • Hiệu quả tài chính và chất lượng doanh thu
  • Mua bán nợ, một phương thức tái cơ cấu doanh nghiệp hiệu quả
  • CEO của Nissan nhận lương cao nhất Nhật Bản
 tinkinhte.com
 tinkinhte.com
 tin kinh te - tinkinhte.com
 tin kinh te - tinkinhte.com