您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [联邦贸易委员会]:人工智能基金会模型透明度法案英 - 发现报告

人工智能基金会模型透明度法案英

信息技术 2024-01-29 - 联邦贸易委员会 李艺华🌸
报告封面

118THCONGRESS1STSESSIONH.R.ll 指示联邦贸易委员会建立标准,以公开有关人工智能基础模型中使用的训练数据和算法的信息,以及用于其他目的。 在代表处 B先生EYER提出了以下法案;该法案已提交委员会llllllllllllll 账单 指示联邦贸易委员会建立标准,以公开有关人工智能基础模型中使用的训练数据和算法的信息,以及其他目的。 1它是由参议院和众议院颁布的- 2美利坚合众国在国会集会, 3第1节。短标题。 4本法可引称为“人工智能基础模型” 52023年透明度法案。“ 6SEC。2。发现。 7国会发现以下内容: 2 1(1)随着公众获得艺术的机会增加-2商业情报,法律有所增加-3诉讼和公众对侵犯版权的担忧-4法院案件,包括以下案件: 5(A)Doe 1诉GitHub,Inc.,第22号- cv -606823,2023 WL 3449131,在* 1(N. D. Cal。72023年5月11日)。 8(B)修正投诉,盖蒂图片社,9公司诉稳定人工智能有限公司,编号23 - cv - 00135 (D.10Del. Mar.29, 2023).11(C)安徒生诉稳定人工智能有限公司,第23号-12cv - 00201,2023 WL 7132064,在* 1(N. D. Cal。132023年10月30日)。 (2)公共使用基础模型导致 15无数的公众被呈现的实例16不准确、不精确或有偏见的信息17在推理过程中,基于有限的训练数据,18推荐的模型训练机制,或者缺乏披露-19关于训练数据组成或基础的保证-20运动模型训练程序,包括面部21识别技术使用,人工智能22与健康有关的推论,人工智能在-23与贷款发放和住房协议有关的规定-24proval,和更多。 3 1(3)高影响力方面的透明度2基础模型变得越来越重要-3必需品,包括协助版权所有者4强迫他们的版权保护和促进5消费者保护。 (4)而不是妥协知识分子 6 7开发和部署人员的财产权8基础模型,用户应配备9实施版权所需的信息10保护并做出明智的决定11这样的基础模型。 12SEC.3.基础模型数据来源和培训 13透明度。 14(a)E稳定S标准——不迟 15在本法颁布之日起9个月内, 17(1)根据标题5第553条,18美国法典,颁布法规,规定-19tablish标准指定信息以改进20覆盖的基础模型的透明度21关于训练数据的实体,模型文档-22推理、数据收集和操作-23基础模型的设计;以及 4 1(2)发布指南,以协助涵盖的实体2符合以下标准3第(1)款。4(b) CONSULTATION-建立标准5并发布(a)款所要求的指引,6委员会须与委员会主任磋商─7国家标准与技术研究所所长8科学和技术政策办公室,Reg -9版权所有者和其他相关利益相关者,在-10包括标准机构、涵盖的实体、学术界、技术人员-11Nology专家,公民权利和公民权利的倡导者-12萨默斯。13(c)SUBMISSIONTOCOMMISSIONANDPUBLICAVAIL-14能力INFORMATION-建立的标准15根据(a)(1)款,须包括规定,16尊重基础模型,因为-17(1)根据该项指明的资料─18节应由19提供此类模型的涵盖实体;以及20(2)根据该项指明的资料─21该条须由以下人士公开提供─22提供此类模型的ered实体。23(d)FORM和MANNER-建立的标准24根据(a)(1)款,须指明格式及方式25在其中,根据该子项指明的某些资料─ 5 1由委员会酌情选择的部分,在2与国家研究所所长协商3标准和技术以及其他行为者4(b)款所述,应公开提供5由涵盖的实体,包括-6(1)应提供哪些信息7与任何相关的受保护实体的网站8此类涵盖实体提供的基础模型;9(2)应在文件中显示哪些信息10委员会托管的网站上的中心位置-11Sion,就某铸造而言,须包括─12TION模型,基本相似的信息13第(1)款要求的信息14在涵盖实体的网站上提供-15提供此类模型的TY;16(3)机器可读格式应为17关于根据18第(1)和(2)款;19(4)指定信息的URL20根据第(2)款,须由委员会主持─21Sion;以及22(5)委员会的附加规格─23特派团认为合适。24(e) PROCESS-根据子-25(a)(1)条须指明一项程序,而该等资料─ 6 1(c)(1)款规定的提交2给委员会。3(f)INFORMATIONTOBEC已考虑-TheCome-4特派团应考虑在标准中指定-5根据(a)(1)款成立的,就某铸造者而言─6TION模型,以下信息:7(1)训练数据的来源(包括,如8适用,个人数据收集和信息9必要的协助版权所有者或数据许可10拥有其版权或数据许可证的持有者11保护)以及是否以及如何收集数据12并在推理过程中保留。13(2)的大小和组成的描述14这样的培训数据,包括广泛的人口统计-15形成、语言信息和其他属性16信息,同时考虑隐私。17(3)有关数据治理程序的信息,18包括如何编辑或处理此类训练数据-19tered.20(4)此类训练数据是如何标记的,以及在-21关于标签有效性的形成22过程进行了评估。23(5)对预期目的和24基础模型的可预见限制或风险, 7 1过去对此类模型的编辑概述,版本2该模型的发布日期,以及该模型的发布日期。3(6)对所涵盖的努力的描述4实体以对齐基础模型和转换-5这样的模型的母公司与-6(A)人工智能风险管理框架7(或任何后继框架)的国家8标准与技术研究所;或9(B)类似的联邦政府- ap -10证明了共识技术标准。11(7)评估中的业绩,要么自我-12驱动或通过审计,在公共或行业立场上-13ard基准,包括哪些预防措施14基础模型需要回答或响应情况-15提供inac风险较高的机构-16策划或有害信息,包括17模型对这些问题的回应,与以下方面有关-18lowing:19(A)医疗、健康或保健问题-20。21(B)生物或化学合成。22(C)网络安全。23(D)选举。24(E)警务,包括预测性警务。25(F)金融贷款决策。 8 1(G)教育。2(H)雇佣或雇佣决定。3(一)公共服务。4(J)与脆弱pop有关的信息-5组织,包括儿童和受保护的班级-6Es.7(8)关于计算能力的信息8用于训练和操作基础模型。9(9)确定的其他必要信息10由委员会与主任协商11国家标准与技术研究所-12Nology,以提高基础模型的透明度-13Is.14(g)CONSIDERATIONOFALTERNATIVEPROVISIONS15FORSPEECIFICTYPESOFF基础MODELS-在ES中-16制定标准并发布所需的指导17根据(a)款,委员会应考虑是否18包括以下方面的替代规定-19(1)开源基础模型;或20(2)基础模型是21或建立在另一个基础模型上,已经22从其他基础重新训练或改编23模型在任何程度上。24(h) A可播放性- The regulations required by25(a)(1)款适用于 9 1是委员会支持-2遵守这样的规定。3(i) UPDATES-不迟于日期后2年4委员会颁布条例的依据是-5根据(a)(1)款要求,不少于每年─6此后,委员会与7国家标准与技术研究所所长-8Nology,shallassessthestandardsestablishedbysuchreg-9并更新该等规例,以纳入10对这些标准进行适当的更新(如果有的话)。11(j)EFORCEMENTBYFEDERALTRADECOMMIS-12SION.—13(1)UNFAIR或欺骗行为或PRAC-14TICES-违反颁布的法规15根据(a) (1)款,须视为违反以下规定─16根据《公约》第18(a)(1)(B)条订立的规例17联邦贸易委员会法(15 U. S. C.1857a(a)(1)(B))关于不公平或欺骗性行为或19实践。20(2)P委员会的其他成员-除了作为亲-21载于(m)(3)(C)款─22(A)监察委员会须执行该条例─23根据(a)(1)款颁布的24以相同的方式,以相同的方式,并与25与以下相同的管辖权、权力和职责 10 1尽管所有适用的条款和规定2联邦贸易委员会法(15 U. S. C.341etseq.)wereincorporatedintoandmadea4本节的一部分;以及5(B)任何违反条例的受保护实体─6根据(a) (1)款公布7应受到处罚,并有权8中规定的特权和豁免9联邦贸易委员会法。10(k) REPORT-不迟于日期后2年11在本法颁布后,委员会应提交12致能源和商业委员会和委员会-13众议院科学、空间和技术委员会14代表和商业委员会,15参议院的科学和运输报告16建立、实施和执行17(a)(1)款规定的标准。18(l)AUTHORIZATIONOFAPPROPRIATIONS-在那里19被授权拨给委员会20执行此部分-21(1) 2025财年1000万美元;以及22(2)此后每个会计年度300万美元。23(m) D定义-在本节中:24(1)A人工智能-术语“ar-25“官方情报”具有这样的含义 11 1国家人工智能第5002节中的术语-22020年情报倡议法(15 U. S. C. 9401;en -3扮演威廉· M · (麦克) ·桑的E部门-4浆果国防授权法案52021年(公法116 - 283))。6(2)COMMISSION-“佣金”一词7指联邦贸易委员会。8(3)COVEREDENTITY.—9(A) IN一般-术语“覆盖en -10“tity ”是指任何人、合伙企业或公司-11(C)项中所述的部分12提供-13(I)使用以下人士或来自以下人士的服务─14生成的TION模型,总体上,15超过100, 000个月输出实例16(无论是文本、图像、视频、音频还是17其他模态),包括输出实例18从用户使用秒生成19使用此类模型的当事方实体;或20(ii)使用以下人士的服务─21TION模型,总的来说,超过22每月30,000个用户,包括23使用此类模型的第二方实体。24(B)U阈值的PDATING-The25委员会,与主任协商 12 1国家标准和2技术和办公室主任3科学技术政策,可根据规定-4根据第5标题5的553,美国法典,更新6pur的每月输出实例数-7(A)(I)项的构成或8用于分段目的的每月用户9(A) (ii)委员会认为认可的─10priate.11(C)PERSONS,PARTNERSHIPS,和COR-12描述的位置-Thepersons,partner-13船舶,以及本子中描述的公司-14段落是-15(i)任何人、合伙或该人─16委员会对其进行了调查17根据第5 (a) (2)条的管辖权18联邦贸易委员会法(15 U. S. C.1945(a)(2));及20(ii)尽管有第4、5(a)(2)条的规定,21联邦贸易委员会法案第6条22(15 U. S. C. 44;45 (A) (2);46)或任何判例-23委员会的法定限制-24(一)任何共同承运人主体251934年通信法 13 1(47 U. S. C. 151等)和所有法案2修改并提供-3在那里停留;和4(II)任何非组织的组织─5Nizedtocarryonbusinessforitsown6利润或其成员的利润。7(4)F基础模型.—8(A)IN一般-“基金会”一词9“模型”是指人工智能模型10That -11(i)接受过广泛数据方面的培训;12(ii)一般使用自我监督;13(iii)一般至少包含141,000,000,000参数;15(iv)适用于广泛的范围16上下文;以及17(v)展品,或可轻易修改─18适应展览,高水平的表现19在可能构成严重风险的任务上20安全,国家经济安全,NA -21国家公共卫生或安全,或任何COM -22这些问题的结合。23(B