您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [美国国家科学院(NAS)]:未来十年社会科学与行为科学方法论的走向:研讨会简报(2025) - 发现报告

未来十年社会科学与行为科学方法论的走向:研讨会简报(2025)

报告封面

未来十年社会和行为科学方法方向的探索:2025年研讨会摘要 详细情况 11页 | 8.5 x 11英寸 | PDF ISBN 978-0-309-73575-9| DOI 10.17226/29083 贡献者 康斯坦斯·F·西特罗,报告人;国家统计委员会;行为和社会科学及教育分部;国家科学院、工程与医学科学院 建议引用 国家科学院、工程学及医学研究院。2025未来十年社会与行为科学方法论的发展方向:研讨会纪要——简要概述华盛顿,DC:美国国家科学院出版社。https://doi.org/10.17226/29083. 访问国家科学院出版社网站 nap.edu,登录或注册后即可获得: — 免费下载数千份出版物 — 打印出版物的价格优惠10% — 通过电子邮件或社交媒体通知您感兴趣的新书信息 — 专属优惠和折扣 所有可下载的全国研究院作品均可免费用于个人及/或非商业学术用途。用户还可以自由地在本网站上发布对我们作品的链接;鼓励非商业学术用户链接到本网站上的版本,而不是分发下载的PDF,以确保所有用户都能访问到作品的最新权威版本。所有其他用途均需获得书面许可。(请求许可) 本PDF受版权保护,所有权属于美国国家科学院;除非另有说明,美国国家科学院保留本PDF中所有材料的版权,并保留所有权利。 于2024年9月25日至26日召开 未来十年社会与行为科学方法论的未来方向 会议工作坊概览 国家科学院、工程科学院和医学科学院(国家科学院)的国家统计委员会(CNSTAT)的规划委员会举行了一次现场和虚拟研讨会,旨在汇集一组广泛的专家,探讨社会科学和行为科学的方法论和分析前沿。目的是确定那些值得更多研究关注、预期将对多个学科产生益处的途径。该研讨会旨在考虑方法和发展,例如人工智能(AI)和机器学习在数据挖掘中的应用,以及因果和空间分析。 采用了多种方法,包括广泛列表生成、为列表编码主题、以及评估和排名可能的议题,以缩小会议议题范围。最终议程涵盖了七个主题:新的数据来源;新的研究设计;因果推断;空间分析的新方向;人工智能与数据分析;传感器、应用程序和其他技术;以及数据保护和传播。1 梅丽莎·丘(CNSTAT主任)解释说,美国国家科学基金会的方法、测量和统计计划定期对新兴的统计方法、模型和创新方法进行环境扫描,以探索社会、行为和经济科学未来研究的发展。她指出,该研讨会为来自不同学科的知名人士提供了一个独特的聚在一起分享见解的机会。 引言 规划委员会主席Kristen Olson(内布拉斯加大学林肯分校)欢迎了与会者,并解释说演讲者将提供他们对当前状态及创新分析、统计和计算方法发展潜力的见解和想法,这些方法可用于多个社会科学和行为科学学科。她说,规划委员会的成员们主持了会议,希望与会者思考在未来的五到十年里,方法论创新可能会走向何方。Olson指出,规划委员会产生的主题远多于两天内所能涵盖的内容。 新的数据来源 凯瑟琳·加尼(密歇根大学)介绍了本次会议。会议的演讲围绕调查与行政和非概率数据的整合、利用人工智能进行数据收集以及应对隐私挑战展开,重点在于权衡利弊。 依赖于非代表性数据和有偏见的来源将增加,从而损害信任和数据效用。Potok强调了在整合调查、行政和开放数据方面进行短期和长期投资的需要,这可以为公共政策(例如,将社会经济地位与气候数据相结合)增添深度和广度,并提高数据质量。她还强调了隐私保护方面的差距,提倡用户责任和滥用细粒度数据的处罚。Potok呼吁研究如何协调纵向数据集与不断变化的数据收集方法,以及如何使用机器学习算法分析复杂的组合数据集以帮助建立因果关系。 安德鲁·默瑟(皮尤研究中心)强调了其中一些重大质量问题。在线自愿参与面板例如,“虚假受访者”提供不可靠的数据。他呼吁采用先进的验证技术,包括利用生成式人工智能进行受访者验证以及整合行政数据以提高被访者样本抽样准确性。尽管回应率下降,Mercer强调概率样本的重要性,因为它们为纠正非概率数据中的偏差提供基准。在他看来,提高准确性与降低成本之间的平衡仍是一个需要进一步探索的关键领域。 Michael Elliott(密歇根大学)提出了以下框架:结合概率样本和非概率样本利用准随机化和双重稳健模型来处理选择偏差。这些方法依赖于高质量辅助数据和忽略假设,这通常具有挑战性。Elliott呼吁扩展这些方法以支持因果推断和小范围估计,同时发展敏感性分析来处理关键假设的失败。在他看来,一个关键的未来方向是改进伪权重的生成,并细化针对这些混合数据集的贝叶斯加性回归树(BART)应用。 Potok和其他参与者强调了建立数据质量标准的重要性,这些标准是科学诚信的核心,以及沟通框架和协作社区,以指导跨学科研究。Potok还评论说,需要进行更多关于在无法获得知情同意的情况下对传感和其他数据进行道德使用的研究,以及如何向政策制定者和公众传达质量和其他关注点的方法。 全新研究设计 弗雷德·奥斯瓦尔德(莱斯大学)介绍了会议,会议内容包括对适应性干预设计、巨型研究设计和AI-人机互动设计的介绍,以加强实验性社会科学和行为科学研究。 布德亨德拉·巴杜里(橡树岭国家实验室)展示了如何遥感可以通过提供高分辨率图像、数字痕迹(例如社交媒体)和生物识别数据来增强社会经济和行为研究。应用包括社区地图绘制和人口密度分析。挑战包括确保数据质量、解决隐私问题以及适应不同的地理环境。他强调,将遥感数据与传统数据源相结合,可以为城市规划、灾害恢复力和社会经济差异提供可操作的见解。 Inbal Nahum-Shani(密歇根大学)解释说适应性干预该干预措施根据参与者随时间变化的反应动态调整 治疗方案。这些干预措施依赖于两个主要框架:用于较慢、人工交付的适应性的序列多重分配随机试验(Sequential Multiple Assignment Randomized Trials),以及用于快速、数字干预的微随机试验(Micro-Randomized Trials)。混合实验设计整合了这两个框架,使得干预措施能够在多个时间尺度及模式下进行——例如,将人工交付的咨询与实时数字信息相结合,用于物质滥用干预。Nahum-Shani 指出,两项关键的研究优先事项是确定最佳排序策略,以及理解治疗效果的异质性,特别是在对复杂健康行为的持续参与方面。 Nancy Potok(NAPx 咨询公司)强调了联邦统计局传统调查设计面临来自响应率下降和预算削减的挑战。.2她觉得这些数据侵蚀是一个真实的问题,这对社会科学研究来说需要基准。否则, 凯瑟琳·米尔克曼(宾夕法尼亚大学)讨论了巨型研究方法,其中,一个大规模的实验框架包括同时进行的多个子实验,以测试各种干预措施以实现既定的结果。她表示,这种方法可以提高可比性、降低成本并加速科学发现。提供的例子涉及能够增加如健身房参与和寻求接种疫苗等活动的小幅激励措施。迄今为止的发现揭示了重复激励、微观激励和明确说明激励来源的语言的重要性。挑战包括预测干预的有效性以及适当管理多个假设检验。在Milkman看来,未来的工作应侧重于改进预测模型以确定“哪些措施对哪些人有效”,并确保研究结果在人口群体中具有普遍性。 信念可能会加深人们的信念,强调识别异质性反应的预测因子是至关重要的。对于巨型研究,许多参与者提出了关于干预措施选择、可扩展性和预测准确性的问题。人工智能-人类实验引发了关于参与者对人工智能的信任、结果的可重复性随着模型的改进而提高以及是否在某些情况下人工智能干预可能优于人工治疗的疑问。对于改变长期行为或例如,受访者处理慢性疾病的方式的实验,几位参与者肯定了持续参与的重要性。 因果推断 Rodrigo Pinto(南佛罗里达大学)介绍了本次会议,会议内容包括增强因果推理框架的方法、利用机器学习解决治疗效果变异、敏感性分析方面的进展、从新的数据源获取计量经济学模型额外指标以及利用现代计算工具。多位演讲者和参与者强调了需要新的工具和方法具备用户友好的特点。 托马斯·科斯特洛(美国大学)强调了转型在其中的关键作用。生成式人工智能在行为科学实验中AI模型,如聊天机器人,可以在交互性研究中充当“帮凶”,提供治疗方法,根据参与者的输入调整响应,并监控数据质量。这一创新为大规模研究说服力、学习和社交互动开辟了新的范例。他强调,AI与人类之间的互动可以提供高生态效度,但同时也存在挑战,例如AI响应中的偏见、因果推断的困难以及随着AI模型发展而带来的可重复性问题。在他看来,研究应侧重于开发分析高维治疗的统计工具,并且研究还应处理这些设计中的伦理考量。 Tyler VanderWeele(哈佛大学)强调了区分以下内容的重要性:协会并且 因果通过稳健的研究设计。他强调了纵向研究相对于横断面研究的重要性,以确保因果解释的有效性。一个值得关注的重要领域是过度简化的心理社会结构的依赖;例如,生活满意度指标可能并不总是与单一的单维潜在变量相一致。范德维尔倡导,当结构假设失败时,应考虑指标特定的因果分析。在他看来,未来的研究重点包括开发额外的测试来调查结构潜在因素,以及扩展将心理社会测量与因果推断框架相协调的方法。 讨论者Stephanie Coffey(美国人口普查局)强调了会议的跨领域主题,指出技术进步为治疗提供、行为测量和干预评估提供了新的方法。在她看来,未来研究的关键领域包括在不同背景下推广研究结果、整合机器学习进行适应性实验以及解决因果推断中的挑战。 詹妮·布兰德(加州大学洛杉矶分校)强调了理解……日益增长的重要性。治疗效应异质性——不同群体对同一干预措施的反应不同。她展示了因果树和机器学习方法在揭示先前未被认识到的异质性的实用性。例如,关于大学完成率的研究 开放式讨论提出了几个关键问题。对于适应性干预措施,参与者就“反效果”的可能性进行了辩论,即微调或纠正可能带来的负面影响。 更广泛地采用先进的因果方法。然而,在扩展现有算法方面仍存在挑战,尤其是对于非参数和高维模型。沙文·王(伊利诺伊大学厄巴纳-香槟分校)指出,缺乏计算资源可能会限制像大规模元分析或网络化系统这样的方法的应用。布兰德和王进一步强调,研究人员需要在方法论严谨性和可用性之间取得平衡,开发用户友好的软件工具和教学资源,以将先进方法整合到社会科学实践中并扩大其可及性。 揭示了边缘化群体,如那些父母收入较低或学校处于劣势的群体,往往能避免低薪工作的能力得到最大幅度的增长。Brand强调了将机器学习的灵活性与因果推断的严谨性相结合的必要性,特别是使用交叉验证等方法来防止过拟合。正如她所指出的,一个关键的研究前沿是利用机器学习来自动识别响应异质性,同时确保社会政策的相关性和可解释性。 蔡斯·辛利(华盛顿大学)讨论了因果推理中强假设的局限性,特别是难以观察到的混杂因素挑战。他介绍了在以下方面的进步:敏感性分析为了量化因果估计对假设违反的稳健性。一个重要的发展包括使用可解释的敏感性参数(如R平方界限)评估遗漏变量偏差的通用非参数框架。Cinelli主张通过能够处理复杂因果模型的算法工具来自动化敏感性分析,这将使研究人员能够更多地专注于理论洞察。 新方向的空间分析 王少文介绍了本会议,会议主要围绕两大主题展开:(a)地理对人类行为、健康和社会结果的影响;(b)空间分析方法、大规模数据的使用以及构建社会空间网络的途径的进展。本会议强调了地理方法在解决复杂社会问题中的日益重要性,为更精细和有效的政策制定铺平了道路。 斯图尔特·福塞明汉(亚利桑那州立大学)在会议中谈到了重要性:地理背景在影响人类决策时,独立于个人属性,如年龄或收入。利用多层次建模和地理加权回归等方法,他展示了位置特定因素在投票偏好变化中所占的显著部分。根据Fotheringham的观点,将地理背景纳入行为模型以改善推断准确性和政策相关性是研究的一个优先方向。 Pinto强调了……的作用新措施在改进的经济行为模型中。传统的计量经济学分析往往由于观测数据的限制而依赖于严格假设。他强调了新型数据来源(如主观预期、社会规范和父母信念)的价