NIST:2024 NIST GenAI(试点研究):文本到文本评估概述和结果(2025) 62页

VIP文档

ID:73919

阅读量:0

大小:2.28 MB

页数:62页

时间:2025-06-19

金币:10

上传者:PASHU
NIST Trustworthy and Responsible AI
NIST AI 700-1
2024 NIST GenAI (Pilot Study):
Text-to-Text Evaluaon Overview and Results
Hari Iyer
Seungmin Seo
Lukas Diduch
Kay Peterson
George Awad
Yooyoung Lee
This publicaon is available free of charge from:
hps://doi.org/10.6028/NIST.AI.700-1
资源描述:

这篇报告是2025年6月美国国家标准与技术研究院(NIST)发布的《2024 NIST生成式人工智能(GenAI)试点研究:文本到文本评估概述和结果》。该研究聚焦于评估文本到文本(T2T)生成和判别任务,以评估生成式AI模型和AI检测器的能力与局限。 1. **背景与目的**:生成式AI发展迅速,其内容真实性和完整性引发担忧。NIST的GenAI计划提供测试平台,本次试点研究旨在衡量AI生成文本模仿人类写作的效果,以及AI判别器区分人类和AI生成内容的能力。 2. **评估框架与流程**:采用多轮评估,生成器(G)和判别器(D)参与者可改进系统。评估涵盖管理平台、注册许可、提交流程等,使用多种性能指标,如AUC、Brier分数等。数据包含多轮测试集,来自多个主题和人工总结。 3. **结果**:AI生成的总结与人类写作越发相似,但检测模型仍能有效区分。不同系统性能差异显著,部分生成器可欺骗多数判别器,部分判别器能检测多数生成器的内容,二者均有提升空间,判别器系统在多轮测试中有改进。 4. **未来方向**:未来工作将聚焦完善评估方法、扩展多模态评估、开发标准化基准协议,为评估生成式AI和AI检测技术提供框架,为研究人员和政策制定者提供指导。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
关闭