文献分享 | 借助大语言模型如何衡量政府企业的关联度

发布者：汪淋淋发布时间：2026-03-04浏览次数：10

题目：Measuring firm exposure to government agencies

作者：Daphne M. Armstrong, Stephen Glaeser, Jeffrey L. Hoopes

发表时间：2025年

发表期刊：Journal of Accounting and Economics

引用格式：Daphne M. Armstrong, Stephen Glaeser, Jeffrey L. Hoopes.(2025).Measuring firm exposure to government agencie.Journal of Accounting and Economics, https://doi.org/10.1016/j.jacceco.2024.101703.

随着人工智能大语言模型的飞快迭代发展，越来越多的学者在研究中使用大语言模型进行辅助。今天，我们向大家分享一篇将传统文本分析方法和大语言模型结合的文章，2025年上发表在会计学顶刊Journal of Accounting and Economics（UTD24，FT50），创新性将传统文本分析与大语言模型结合，革新了企业政府关联度的测量方法，并且通过严谨的实证对比发现：在高度结构化的监管文本场景中，简单的词典法与复杂的GPT模型效果相当。具体内容如下：

一、摘要

本文使用强制性会计报告的文本分析方法，开发了基于公司层面的、随时间变化的政府机构关联度衡量标准，包括证券交易委员会（SEC）和国税局（IRS）。这些衡量标准在不同行业之间具有可预测的差异，并与特定机构事件（如《萨班斯-奥克斯利法案》对SEC的影响以及IRS预算削减）相关。研究表明，这些衡量标准与未公开的机构调查和财务报表下载之间存在正相关关系。公司的整体政府机构暴露与其盈利能力呈负相关，符合暴露于政府机构会带来净成本的观点。根据这些结果的因果解释，特朗普意外当选总统后，市场对减少政府机构权力的预期表现出积极的股市反应，而这一反应与公司暴露于政府机构的程度呈正相关。作为我们衡量标准的初步应用，我们展示了SEC监管的扩展提高了公司的股票流动性，而IRS监管的减少则降低了公司的有效税率。

二、研究背景

1. 政府机构监管与企业经营的现实困境

政府机构在企业经营中扮演着举足轻重的角色。从证券交易委员会（SEC）的信息披露监管，到国税局（IRS）的税务稽查，从食品药品监督管理局（FDA）的产品审批，到环境保护署（EPA）的污染管控，政府机构通过规则制定、执法行动和日常监督等多种方式深刻影响着企业的运营决策和财务表现。长期以来学术界缺乏系统性的方法来衡量企业个体对政府机构的暴露程度。现有研究大多聚焦于单一法规（如《萨班斯-奥克斯利法案》）或特定行业的监管差异，未能从企业层面、时间维度上捕捉企业与各类政府机构的关联强度。这一研究空白限制了我们对政府监管经济后果的深入理解。

2. 文本分析方法的发展与局限

近年来，文本分析技术在会计与金融研究中得到了广泛应用。研究者通过分析企业年报、电话会议记录等文本数据，提取有价值的信息来度量各种经济构念。传统的词典法（Dictionary-based Approach）因其简单直观、可解释性强而备受青睐。传统词典法也面临一些挑战：如何准确识别文本中的监管暴露语义？如何处理一词多义或语境依赖的表达？如何确保测量结果的有效性和可靠性？这些问题促使研究者不断探索更先进的文本分析技术。

3. 大语言模型带来的新机遇

随着生成式人工智能（Generative AI）和大语言模型（Large Language Models, LLMs）的快速发展，学术研究迎来了新的方法论工具。以GPT系列模型为代表的大语言模型具备强大的自然语言理解能力，能够在零样本（Zero-shot）或少样本（Few-shot）条件下完成复杂的文本分析任务。在这一背景下，作者系统比较了传统词典法与大语言模型方法在衡量企业政府关联度方面的表现，为研究者选择合适的方法论工具提供了重要参考。

三、研究问题

1.如何构建企业层面、随时间变化的政府机构关联度衡量指标？

2.这些衡量指标能否有效预测企业实际面临的政府监管强度（如未公开的SEC调查、政府机构下载企业财报的行为）？

3.企业暴露于政府机构与其经营绩效之间存在何种关系？

4.在高度结构化的监管文本场景中，基于大语言模型的AI方法是否显著优于传统的词典法？

四、理论基础

1.公共选择理论

将政府监管视为一种特殊的"公共物品"供给机制——监管机构被赋予纠正市场失灵的使命，如缓解信息不对称、遏制垄断势力、控制负外部性等，但其自身也面临着目标函数复杂化、激励扭曲和官僚扩张的问题。这意味着监管既可能通过约束机会主义行为而增进社会福利，也可能因过度干预而变成企业的沉重负担。

2.俘获理论

该理论进一步揭示了监管关系的动态博弈本质。Stigler的经典研究表明，受监管企业有强烈的动机通过游说、政治关联甚至"旋转门"雇佣等方式影响监管规则的形成与执行。在这一视角下，监管关联度本身成为企业策略性投资的对象——高关联度可能意味着企业被严格约束，也可能意味着企业成功"俘获"了监管机构以获取有利的规则待遇。Armstrong等人的研究通过区分不同机构、不同企业的关联度差异，为检验俘获理论的实证含义提供了精细的数据基础。

五、研究设计

1.词典法构建关联度指标

研究团队的核心创新在于设计了一套简洁而精准的文本识别规则。他们从美国总务管理局官网获取了完整的联邦政府机构名单，涵盖SEC、IRS、FDA、EPA等主要监管机构。在文本处理环节，他们采用"双重匹配"策略：首先识别包含机构名称或标准缩写的句子，然后进一步筛选包含监管行动词的表述。这些行动词包括"regulation"、"audit"、"investigation"、"compliance"、"enforcement"等，涵盖了规则制定、执法审查、合规要求等监管活动的核心语义。这种设计巧妙地排除了诸如引用劳工统计局CPI数据之类的无关提及——虽然句子中出现了"Department of Labor"，但缺乏监管行动词，故不计入关联度。

最终的指标构建采用比例形式，以控制年报长度随时间增长的趋势。具体而言，某机构关联度等于提及该机构的监管相关句子数占年报总句子数的比例，总政府关联度则为各机构关联度之和。这种标准化处理使得不同年份、不同企业之间的比较成为可能，也避免了简单计数可能带来的规模偏差。

2.大语言模型对比方法

为了评估AI方法的增量价值，作者利用OpenAI的GPT-3.5 Turbo模型构建了替代性指标。他们提取所有包含"SEC"的句子，向模型输入如下提示："A company is exposed to the Securities and Exchange Commission (SEC) if there are potential or realized SEC actions that can directly or indirectly affect a company's behavior or outcomes. Does the company explicitly mention its exposure to the SEC in the sentence provided? Answer with one word, Yes or No." 这种零样本（Zero-shot）设计刻意避免向模型提供预标注示例，以测试其自主推理能力而非模仿人类标注倾向。模型判断为"Yes"的句子比例，即为AI版的SEC关联度。

3.验证策略

指标的有效性通过四个递进层次加以验证。第一，时间趋势验证——考察指标是否与《联邦法规汇编》页数的长期增长相一致。第二，行业分布验证——检验不同机构的关联度是否集中在与其职能匹配的行业。第三，外生冲击验证——观察重大政策事件（如SOX法案、IRS预算削减）是否引起关联度的预期变化。第四，预测能力验证——利用未公开SEC调查数据和机构下载记录，检验关联度是否能预测实际监管行为。这一多层次的验证体系确保了指标不仅具有表面效度，更具备预测效度和构念效度。

六、主要发现

1.年报里的监管讨论越多，企业越可能正被政府暗中调查

数据显示，1998年至2019年间，企业的平均政府关联度呈现稳定上升趋势，从约0.5%增长至超过1.5%，与同期联邦法规页数从13万页膨胀至近19万页的趋势高度吻合。这一平行趋势强烈暗示，文本指标确实捕捉到了监管环境的真实变化，而非仅仅是企业披露策略的演变。从横截面分布看，教育服务、医疗保健和化学制造是关联度最高的三个行业——值得注意的是，后两者并非传统意义上的"受监管行业"，这表明基于企业层面的度量能够发现被行业分类所掩盖的监管差异。

2.政府管得越严，企业盈利能力越差

在控制企业和行业-年份固定效应后，总政府关联度与企业的税前资产回报率显著负相关。关联度每增加一个标准差，ROA下降约0.3个百分点；在最严格的设定下，降幅可达1.8个百分点。这一负相关关系可能源于合规成本的直接侵蚀、管理注意力的分散、战略灵活性的约束，或是监管不确定性导致的投资延迟

3.特朗普意外当选后，被严管的企业股价涨得最猛

特朗普在竞选期间明确承诺"解构行政国家"，要将联邦法规削减70%，而选前主流预测模型显示其胜率不足30%。选举结果揭晓后，高政府关联度企业的股票在五个交易日内显著跑赢低关联度企业约3个百分点（等权组合）或2.2个百分点（市值加权组合）。这一市场反应强烈暗示：投资者确实将政府监管视为企业价值的减项，而监管放松预期带来了显著的估值修复。

4.复杂的AI模型在这个场景下并不比简单词典法强

GPT-3.5构建的AI版SEC关联度与词典法指标的相关性约为44%，两者均显著预测未公开SEC调查和SEC下载行为。然而，在直接对比中，两种方法的预测能力并无统计显著差异：预测调查时，词典法系数为2.13，AI法为2.17，F检验p值为0.99；预测下载时，词典法系数为5.86，AI法为9.54，F检验p值为0.86。政府机构拥有标准化的名称和广泛认可的缩写，监管语境的词汇集相对有限且语义明确，这使得基于规则的词典法已经能够精准捕捉所需信息。换言之，在高度结构化的监管文本场景中，复杂的深度学习模型并未带来显著的增量收益。

作者对此给出了富有洞见的解释：政府机构拥有标准化的名称和广泛认可的缩写，监管语境的词汇集相对有限且语义明确，这使得基于规则的词典法已经能够精准捕捉所需信息。大语言模型的"推理优势"在语义模糊、语境依赖、非结构化表达的场景中可能大放异彩，但在本研究所聚焦的特定领域，其边际贡献有限。这一发现并非否定AI方法的价值，而是倡导一种"因场景制宜"的方法论自觉——技术的选择应服务于研究问题，而非为技术而技术。

七、研究贡献与启示

这项研究在多个维度上推进了相关文献。在测量工具层面，它首次提供了企业层面、随时间变化、机构特异性的政府监管关联度指标，填补了长期存在的方法论空白。在理论验证层面，它通过精细的数据分析支持了监管成本理论，揭示了监管碎片化（多个非协调机构重叠监管）对盈利能力的放大效应，为制度设计提供了实证依据。在方法论层面，它通过严谨的head-to-head比较，为文本分析方法的选择提供了基于证据的指导。

对于学术研究者，这项研究的方法论启示或许最为深远。在生成式AI引发方

法论革命的今天，它提醒我们保持一种清醒的"技术实用主义"——既不固守传统而错失创新机遇，也不盲目追新而忽视简单方法的威力。正如Bae等（2023）所倡导的，"简单是文本分析工作的指导原则"，因为简单方法往往更具可解释性、可复制性和稳健性。在特定的研究场景中，精心设计的简单规则可能比复杂的黑箱模型更能准确地捕捉构念的本质。

七、结语

Armstrong、Glaeser和Hoopes的这项研究，以其简洁的方法设计、严谨的验证策略和深刻的方法论反思，为我们展示了好的学术研究应有的样子。它告诉我们，最有价值的研究工具往往源于对现实问题的敏锐观察，而非对技术潮流的盲目追逐；最有说服力的实证发现往往建立在多重验证的基础之上，而非单一统计显著性的展示；最有持久影响力的方法论贡献往往带有"反潮流"的勇气，敢于在AI狂热中捍卫简单方法的价值。

当越来越多的研究者开始尝试用大语言模型分析企业文本时，这篇文章提供了一个重要的参照系，在结构化文本、明确语义、有限语境的场景中，词典法可能仍然是足够好的选择；而在非结构化文本、模糊语义、复杂语境的场景中，AI方法的优势可能会充分显现。关键在于研究者需要对自己所研究的问题、所分析的数据、所依赖的假设有清醒的认识，从而做出明智的方法论决策。这或许是对当下会计与金融研究中"AI焦虑"的一剂最好解药。

资料来源：中国智能管理研究院微信公众号