通过机器学习确定的离婚的预测因素
更新时间:2022-03-16 11:15:21 浏览次数:147+次与博科尼的Dondena社会动态和公共政策研究中心有关的学者们最近使用了一种叫做机器学习(ML)的技术来分析参加德国社会经济小组调查的2038对已婚或同居夫妇的数据。大消息是什么?它能够预测夫妻离婚的首要原因:女性的家务比例和伴侣双方的生活满意度。
根据在线发表在《人口学》上的文章,参与研究的夫妇平均被观察了12年。这意味着总共有18,613个观察值,这是一组大规模的数据,可能难以管理。
“门卡里尼教授说:”考虑所有变量及其可能的相互作用的潜在困难的一个明显的例子涉及’五大’人格特征。”要考虑伴侣双方的特质(10个变量)和他们所有的双向互动(25个变量),就需要包括35个独立变量,这在回归模型中会有很大问题。”
幸运的是,Bruno Arpino(佛罗伦萨大学)、Marco Le Moglie(米兰天主教大学)和Letizia Mencarini(Bocconi)能够通过RSF成功管理传统模型中的大量独立变量。据他们说,ML工具可以在相对较小的数据集中检测出复杂的模式。
为了证明ML与传统模型相比具有更强的预测能力,作者将他们研究中的样本分成了两部分。并利用前半部分的结果,他们能够准确地预测后半部分的结果。据他们说,这表明RSF的预测准确性是多么有效。然而,他们也提到,尽管使用了文献中确定的所有最重要的工会解体预测因素作为输入变量,但RSF的预测准确性还是有限。
最后,研究指出,一些具有最大预测能力的变量是男性的外向程度、女性的家务比例、女性的工作时间、女性的开放程度、夫妻的婚姻状况和双方的生活满意度。