美国华人
第1819篇文章
近来,中文社交媒体上有许多关于美国新冠死亡人数和年龄的讨论。今收到非常活跃的北美《国际时政群》群友的投稿,我们原文照登,与读者分享他们的观点。
正文共:5059字
预计阅读时间:13分钟
撰文:《国际时政群》群友
2020年9月5日,美国新冠确诊人数620万人,死亡人数18.8万。(来源:《纽约时报》)
张勇进
昨天上午,葛瑞兄给我转来两篇文章,一篇是琥珀风筝写的《美国因新冠去世患者的年龄中位数为78岁》,一篇是项西行写的《新冠死者平均年龄78,是否意味着死者仅仅“减短寿命几个月”?》,显然,项西行的文章是对琥珀风筝文章所做的批驳——虽然,在项西行的文章中没有直接点名琥珀风筝,但他却在文章的开头写下了这样的文字:
“最近美国CDC出了一个新冠的统计报告,揭示了美国所有新冠死者年龄的中位数(Median)是78岁。这一方面确认了老人是新冠病毒的最大受害者之外,也让个别有心的读者灵机一动。他们查到这几年美国的平均预期寿命为78.6岁,那么好像得出了一个结论:美国人本来的平均寿命就是78岁多,而新冠致死的平均年龄也正是78岁,那岂不就证明了在平均上也就让死者损失了几个月的寿命?言外之意,那后果好像也不太严重嘛!既然如此,何必要如临大敌让经济停摆呢?”
仔细读了这两篇文章,我觉得这两个作者都犯了同样的毛病,就是把中位数和平均数混淆了起来,并且直接拿中位数与平均数进行比较,犯了统计口径不一致的错误。例如:
1、琥珀风筝在文章中说,美国在新冠疫情中死亡的人,其年龄的中位数为78岁,请注意,在这里琥珀风筝没有使用平均死亡年龄,而使用了死亡年龄的中位数,但是,当琥珀风筝拿78岁的死亡年龄中位数去与这几年美国平均预期寿命78.6岁进行比较时,这时,两个概念(中位数和平均数)实际上是不能直接进行比较的,但琥珀风筝却忽略了。其实,根据琥珀风筝在文章中的交代,在CDC的统计结果中,65岁以上的死者占80%,而四分位数的间距为67-87岁,即50%的死者集中在67-87岁,如果再做进一步细分,则:0-66岁的死亡人数为25%(其中65-66岁的占5%);67-78岁的死亡人数占25%;79-87岁的死亡人数占25%;88-100岁以上的死亡人数占25%。按照这样的年龄结构,我们很容易推断,死于新冠病毒的人口平均年龄应该是在80岁以上,而不是以中位数表示的78岁。也就是说,此次疫情中有将近50%的死者年龄都已超过美国的平均寿命。
2、在项西行的文章中,在我的理解中,他实际上讲了两个问题:第一,平均寿命是以全部人口为统计基数的,即它包括了不同年龄段死亡率对平均寿命的影响。但是,由于不同年龄段的死亡率是不同的,尤其是这几年美国中年人的死亡率上升,有可能导致平均寿命出现波动,所以,根据2017年的测算,美国人的平均寿命为78岁,其中,男性为76.1岁,女性为81.1岁。但是,由于老年人(65岁以上)已经退出职场,竞争压力减少,其平均寿命可能会延长。第二,项西行引用了谷歌的一个预期寿命测算模型,这个模型告诉读者,如果一个男性目前已经活到78岁,那么,他的平均预期寿命就可以增加9年多,即他的实际寿命可以达到87岁。在这里,由于我无法翻墙,我不能按照项西行提供的网址去研究谷歌的这一测算模型,所以,我暂且认为这一模型是可靠的。
项西行的文章至此都没有问题,但是,文章的最后一段话却令人生疑:
“我计算了一下,对于一个78岁方方面面情况良好的人来说,糖尿病的因素会让他的预算寿命短2年。也就是说,如果一个有糖尿病的78岁老人,如果不幸得了新冠挂掉了,他平均损失的寿命绝不是“仅仅几个月”,而是9.4减2 = 7.4年宝贵的生命时光。”
在这里,表面上项西行是在讲一个特例,但实际上,他却在暗示一个普遍的问题,即通过比较CDC公布的78岁中位数,项西行认为,这次疫情让美国老年人因各种基础病(如糖尿病)都被减少了7年多寿命(平均数?)。然而,这里的问题关键在于,我在前面已经指出,CDC公布的78岁的中位数不代表死亡的平均数,实际的死亡平均数可能要超过80岁,从而理论上被新冠折寿的年岁要小于7年。之所以项西行非要说成7年,其中的原因,就是项西行没有意识到琥珀风筝在使用中位数和平均数时错误回避了两者的差异,以及由此带来的数据变化,否则,项西行就不会一直拿78岁说事。
杨子竹(黑洞)
简谈张勇进先生对项西行《新冠死者平均年龄78,是否意味着死者仅仅「减短寿命几个月」?》一文的评论:项西行的文章的论点是要驳斥新冠病毒死者仅仅「减短寿命几个月」的谬论。其文指出「个别有心的读者灵机一动。他们查到这几年美国的平均预期寿命为78.6岁,那么好像得出了一个结论:美国人本来的平均寿命就是78岁多,而新冠致死的平均年龄也正是78岁,那岂不就证明了在平均上也就让死者损失了几个月的寿命?言外之意,那后果好像也不太严重嘛!既然如此,何必要如临大敌让经济停摆呢?⋯⋯」,作者引用这句话非作者本人之看法,而是某些市井人物的意见,所以张勇进先生把这句话误以为是作者的看法就是错误的。我查阅的CDC统计的死亡年龄分布图与曲线如下:
其中45~54岁死亡9047人,55~64岁死亡21552人,65~74岁死亡36434人,75~84岁死亡45022人,85岁以上死亡53383人。44岁之前个阶段都有死亡,人数较少,在此不列出了。以上55岁以上的人死亡人数就已经比较多,张勇进给出平均死亡年龄可能超过80岁是不对的,CDC的数据没有给出死亡年龄的平均数,所以项西行自然没有必要非得拿死亡平均年龄来说事,即便所谓的死亡中位数78岁也是临时性的,CDC声明指出,死亡数据编码是一件复杂的事情,数据滞后严重,所以这个中位数也是不准确的,但是不影响项西行以78岁(或者其他年龄也可)老人得了新冠病毒挂了,推导这位老人损失的寿命绝不仅仅是几个月,而是7.4年的宝贵时光。结论:项西行的逻辑论证合理,作者仅仅把市井人物的说词拿来批驳,张勇进指责项西行混淆中位数与平均数」的概念没有道理,项西行的论证逻辑没有毛病。
数据来源:
https://www.cdc.gov/nchs/nvss/vsrr/covid_weekly/index.htm
张勇进先生看到我的数据后,回应了这段文字:「黑洞的文字提供了一个很好的数据,就是不同年龄段的确切死亡人数,这也是我一直在寻找的数据,而根据这个数据,只要通过加权平均数的计算方法,都可以算出这次死亡的平均年龄就是大于80岁的。所以,我一开始的假设是成立的。」他提到美国新冠病毒死亡年龄的平均加权计算方法的年龄是大于80岁,真的是吗?那么我们不妨根据CDC提供的这张图表
前文我已经列明55岁以上人群新冠病毒死亡年龄段分布,这里再列出1岁~54岁人群死亡年龄分布:1岁死亡18人,2~4岁死亡14人,5~14死亡28, 15~24死亡300,25~34死亡1318,35~44死亡3450,45~54死亡9047,55岁以上见前文所列!根据简单的数学加权平均值计算公式:
可以计算出美国新冠病毒死亡的平均年龄是77岁,张勇进先生说是80岁或80岁以上是偏高的,关于美国这次新冠病毒死亡平均年龄,在这裡特别强调一下,我们把新冠肺炎死亡病例按年龄进行分析时,美国其实处在一个异常值。”6月24日,英国《经济学人》以此为题报道称,美国疾控中心发布的最新数据显示,美国新冠死亡病例年龄明显偏低。报道称,在大家的普遍意识里,年纪大的人在被感染新冠肺炎后面临的风险最大。在一些被新冠肺炎影响的国家中,约60%死亡病例年龄在80岁以上。然而,美国却是个例外。
报道援引美国疾病控制中心(CDC)6月16日发布的数据称,美国新冠肺炎死亡病例的年龄“明显偏年轻”。数据显示,在美国新冠死亡病例中,80多岁的人仅占不到一半,与此同时,40岁至78岁岁的人占绝大多数。不仅如此,报道还提到,美国新冠肺炎患者的平均年龄是48岁,但意大利是63岁。美国新冠患者与死亡者年龄比欧洲普遍明显偏年轻,一个原因就是美国人普遍偏胖。张勇进先生说的所谓美国新冠死亡年龄平均在80岁以上,不知道是怎样计算出来的?以上我提供的CDC的数据明确指出,美国新冠死亡者中,80岁以上老人比率不到整个死亡人口的一半(约44%)。https://world.gmw.cn/2020-06/28/content_33945463.htm?s=mlt
关于美国平均预期寿命为78.6岁,是一种综合的平均值,并不意味著每一个人都是这个寿命,这裡提供一个美国社会保障局的寿命模型计算方法https://www.ssa.gov/cgi-bin/longevity.cgi ,每一个人都可以根据模型的要求,由你目前的年龄计算出你的寿命,许多人的寿命是大于84岁以上的。COVID-19大流行相关的死亡负担的信息,包括直接或间接归因于COVID-19的死亡。美国CDC有一套完整的计算方法,见https://www.cdc.gov/nchs/nvss/vsrr/covid19/excess_deaths.htm。
综上所述,在欧美,78岁就是老年人的黄金年龄,在西欧国家这是退休老人最活跃的时间,你可以在奥地利、瑞士的街头,随处可以看见85岁以上年龄的退休老人活泼的漫步风姿。美国由于川普的渎职失职,已经导致美国新冠病毒死亡人数超过19万人口,是天灾更是人祸!
最后支持项西行作者的论点:对于一个78岁左右的方方面面情况良好的老人来说,儘管他(她)有某种基础疾病(这些基础疾病在欧美国家是比较容易维持正常生活状态的),如果不幸得了新冠挂掉,他(她)平均损失的寿命绝对不是仅仅几个月,而是至少7年以上(根据Retirement & Survivors Benefits: Life Expectancy Calculator美国社会保障局模型计算)宝贵的生命时光。
馀葛瑞
张勇进兄的评论同样存在误区:
1. 项西行文中已经对中位数和平均数做了进一步明确的划分:“最近美国CDC出了一个新冠的统计报告,揭示了美国所有新冠死者年龄的中位数(Median)是78岁。这一方面确认了老人是新冠病毒的最大受害者之外,也让个别有心的读者灵机一动。他们查到这几年美国的平均预期寿命为78.6岁,那么好像得出了一个结论:美国人本来的平均寿命就是78岁多,而新冠致死的平均年龄也正是78岁,那岂不就证明了在平均上也就让死者损失了几个月的寿命?言外之意,那后果好像也不太严重嘛!既然如此,何必要如临大敌让经济停摆呢?”。这已明确表示作者是完全清楚平均数与中位值的差异。你如是说:“我仔细读了这两篇文章,我觉得这两个作者都犯了同样的毛病,就是把中位数和平均数混淆了起来,并且直接拿中位数与平均数进行比较,犯了统计口径不一致的错误。”
2.项西行原文在哪里“批评琥珀拿78岁的中位数与78.6岁(被你在群里评论中改成78.8)的平均年龄进行比较,但他并没有明确指出中位数是不能直接与平均数进行比较的“?然后你以不存在的原文,得出你自己的结论:“所以,他在拿经过谷歌模型修正的87岁与琥珀的78岁比较时,仍然犯了同样的毛病。” 这不是作者犯了毛病,而是你这位点评者犯了毛病。将不同版本的内容和作家混为一谈,硬给作者加上“平均值和中位值混乱“之假象。但这并非项文有中位数与平均数的概念之混乱。项文可能是巧合,或者是有意无意地确有批评琥珀一文之嫌疑,但这不足以得出你批评项文论点的前提存在的合理性。
3.项文结尾处說”我计算了一下,对于一个78岁方方面面情况良好的人来说,糖尿病的因素会让他的预算寿命短2年。也就是说,如果一个有糖尿病的78岁老人,如果不幸得了新冠挂掉了,他平均损失的寿命绝不是“仅仅几个月”,而是9.4减2 = 7.4年宝贵的生命时光。” 这个计算方法的可靠性和合理性有待与作者本人商榷。但这并不等同项文有中位数与平均数的概念混淆。
你提出一个假设,认定项西行这篇文章是有错的,“就是把中位数和平均数混淆了起来”,事实上你这个假设本身就是不成立的。然后你不断地加以发挥,这才是关键问题所在。当你提出一个假设,这个假设必须是有可能成立才能继续讨论。但恰恰你的假设在事实和邏輯上不成立,这就无疑变成了一个假命题。这种假命题式批评法,與原文和事實不符,没有任何邏輯相关性,也就没有讨论的必要了。我们应该区分如果一篇文章有计算上的错误并不等于该文有概念上的错误,两者并不等同。
欢迎留言,发表您的高见。
本文由作者投稿,内容不一定代表“美国华人”微信公众号立场。
阅读原文 Read more
更多精彩内容
点赞+点在看=鼓励一下