中文机翻:NIST:说话人身份识别系统中身份泄漏的评估(2025) 7页_transResult

VIP文档

ID:74386

阅读量:0

大小:0.10 MB

页数:7页

时间:2025-08-23

金币:10

上传者:PASHU
评估说话人去识别系统中的身份泄漏
Seungmin Seo,Oleg Aulov,Afzal Godil,Kevin Mangold
国家标准与技术研究所,美国马里兰州盖瑟斯堡
摘要
说话人去识别旨在隐藏说话人的身份,同时保持底层语
音的可理解性。我们引入了一个基准,它用三个互补的
错误率来量化剩余身份泄漏年龄:等错误率、累积匹配
Procrustes
量的嵌入空间相似性。评估结果显示,所有最先进的说
话人去识别系统都会泄漏身份信息。在我们的评估中,
性能最高的系统的表现仅略好于随机猜测,而性能最低
CMC 50 45%
率。这些发现强调了当前说话人去识别技术中持续存在
的隐私风险。
索引术语-说话人去识别、语音隐私、身份泄露
1. 介绍
我们通过视频会议平台、语音助手和呼叫中心记录器传
输的语音传达的远不止词汇内容:它嵌入了可以挑出个
人的生物特征。最近的隐私法规——最突出的是欧盟的
GDPR
CCPA
【1,2】。
(SDID)系统已经成为研究的重点。与离线语音换或
SDID
迟预保持可理解性和自性,同时承受来自最先
的说话人识别型的攻击[3]
组件-例。解说话者——内容表示学习[4]
经音频[5]——已经显示出希望但该领域仍
然缺乏一个问题严格答案:有多少身份信息通过
端到端 SDID 管道“泄露”?
先前的研究很难比较[6789,10,11,
情况,我引入了一身份
露评估套件该套件集成了 EER、累积匹配特征(CMC)
CCA
量,然后 Procrustes 比对【13】。
EER CMC
泄漏,嵌入分表征在空间中位置
SDID
和评估机构独本文研究隐私量。在这
系统都会泄露身份:实现的能仅
CMC
的前 50 个候选中,最的系统达 45%的命中率。这
发现强调、保护隐私的说话人去识别的持续挑
2. 说话人去识别系统
SDID NIST ——
是在 IARPA ARTS 1 下开发的——包括四
线
写本公开的系描述,因
文献反映了同一研究人的相关作。[14,15,16,17]
1
2
确保为同一说话人生成的去识别片段(在相同不同
名化简档下)是一或适当的。
3.
3.1. 数据
评估 Mixer 3 [18]了以
语为语的人
12];大多依赖个说话人识别后端并且
一个单独量,等错误率(EER)。前进
1www.iarpa.gov/research-programs/arts
资源描述:

“Evaluating Identity Leakage in Speaker De-Identification Systems”一文介绍了一种用于量化说话人去识别系统中残留身份泄露的基准测试方法,该方法包含三个互补的错误率指标。研究结果表明,所有现有系统都存在身份信息泄露问题,即使是性能最佳的系统也仅略优于随机猜测,而性能最差的系统在前50个候选者中的命中率达到了45%。这凸显了当前说话人去识别技术中持续存在的隐私风险。 1. **说话人去识别系统**:五个系统提交给NIST评估,目标是防止说话人识别模型链接原始语音和去识别后的语音,并确保为同一说话人生成的去识别语音片段的一致性或差异性。 2. **评估** - **数据**:评估集来自Mixer 3语料库,保留至少有五个录音会话的美国英语母语者,共223人。 - **试验**:设计了不同的试验场景,包括目标试验和非目标试验,以评估系统在不同条件下的性能。 - **说话人识别系统**:使用了三种基于不同架构和训练策略的说话人识别模型。 - **去识别有效性**:通过比较原始语音和去识别后的语音,评估系统打破两者之间联系的能力。 - **匿名稳定性和配置文件冲突**:评估系统是否能在不同话语中保持一致的伪语音。 - **同一说话人匿名配置文件的区别**:测试不同匿名配置文件生成的去识别片段是否可区分。 - **测量身份泄露**:使用三种指标来衡量身份泄露,包括CMC命中率、AUC-CMC和嵌入空间相似度。 3. **结论**:多视图分析表明,身份泄露是普遍存在的,但具有异质性。单一指标评估可能会误判风险,所有系统都存在可检测到的身份泄露痕迹。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
关闭