NIST：2024 NIST GenAI（试点研究）：文本到文本评估概述和结果（2025） 62页

VIP文档

ID：73919

阅读量：0

大小：2.28 MB

页数：62页

时间：2025-06-19

金币：10

上传者：PASHU

NIST Trustworthy and Responsible AI

NIST AI 700-1

2024 NIST GenAI (Pilot Study):

Text-to-Text Evaluaon Overview and Results

Hari Iyer

Seungmin Seo

Lukas Diduch

Kay Peterson

George Awad

Yooyoung Lee

This publicaon is available free of charge from:

hps://doi.org/10.6028/NIST.AI.700-1

资源描述：

这篇报告是2025年6月美国国家标准与技术研究院（NIST）发布的《2024 NIST生成式人工智能（GenAI）试点研究：文本到文本评估概述和结果》。该研究聚焦于评估文本到文本（T2T）生成和判别任务，以评估生成式AI模型和AI检测器的能力与局限。 1. **背景与目的**：生成式AI发展迅速，其内容真实性和完整性引发担忧。NIST的GenAI计划提供测试平台，本次试点研究旨在衡量AI生成文本模仿人类写作的效果，以及AI判别器区分人类和AI生成内容的能力。 2. **评估框架与流程**：采用多轮评估，生成器（G）和判别器（D）参与者可改进系统。评估涵盖管理平台、注册许可、提交流程等，使用多种性能指标，如AUC、Brier分数等。数据包含多轮测试集，来自多个主题和人工总结。 3. **结果**：AI生成的总结与人类写作越发相似，但检测模型仍能有效区分。不同系统性能差异显著，部分生成器可欺骗多数判别器，部分判别器能检测多数生成器的内容，二者均有提升空间，判别器系统在多轮测试中有改进。 4. **未来方向**：未来工作将聚焦完善评估方法、扩展多模态评估、开发标准化基准协议，为评估生成式AI和AI检测技术提供框架，为研究人员和政策制定者提供指导。

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 5 / 62



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

版权提示

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

大家都在看

近期热门

NIST：2024 NIST GenAI（试点研究）：文本到文本评估概述和结果（2025） 62页

最近更新

大家都在看

相关文章

相关标签