期限项目:多说话者识别源码

judgment_48088 6 0 ZIP 2021-02-22 10:02:35

学期项目用于流媒体服务转录的多扬声器识别作者: zhang 王一凡产品使命我们将使用的产品是流式多扬声器自动实时转录(SMART)。该产品使用多说话者检测和语音对文本进行转录,以在任何流服务上实现电影,视频和歌曲的自动转录。当前,对于音乐和电影转录,Spotify和Netflix等流媒体服务有时会根据上传者或编辑者是否上传字幕来提供内容的字幕,字幕或歌词,因此,由于它们的作用是手动输入歌词或字幕文件,然后匹配时间范围,以使观看者和听众可以查看字幕。但是,通过使用SMART,应该能够为流网络上的任何内容自动生成转录,从而为任何内容,任何场景或音乐的一部分自动生成转录,用户始终

文件列表

Term-Project-main.zip (预估有个12文件)

Term-Project-main

speaker_diarization

speaker_diarization.py 1KB

Capture1.PNG 7KB

result.md 329B

introduction.md 324B

A1 team-8 term project poster.pdf 638KB

A1 team8.pptx 129KB

audio_recognition.py 1KB

google-api script

term_project2.py 2KB

term_project.py 1KB

video sample.mp4 8.2MB

google-api-script

readme.md 516B

README.md 8KB

用户评论

暂无评论

dede多说评论插件

多说，一款实用好用的社会化评论插件，源自多说团队一个简单的想法：让网络世界链接得更加紧密。为了让中小站长更方便的使用多说，该团队首先开发了多说WordPress插件，自去年年底上线以来，插件累计下载量

20 2019-04-10
matlab话者识别

matlab写的话者识别的程序，界面简单大方，程序绝对好用，能学习人的声音并且识别，进行话者识别和分析

22 2019-07-06
django translations完美主义者的Django模型翻译有最后期限源码

Django翻译 Django模型转换,适用于有期限的完美主义者。目标内容有两种,每种都有自己的翻译挑战: 静态内容:这是代码中定义的内容。例如:“请输入一个有效的电子邮件地址。” Django

12 2021-02-19
基于连续语音的说话人识别.zip

本代码是基于DTW(动态时间规则)算法以及GMM(混合高斯模型)进行的说话人识别的程序。现在大部分的说话人识别模型是基于MFCC的混合高斯模型设计的,但基于此的识别方式会受说话人之间相互模仿的影响,

28 2020-10-30
基于FPGA的说话人识别系统设计

基于FPGA的说话人识别系统设计基于FPGA的说话人识别系统设计陈勇，李晶皎，石鑫，张莉佳摘要：说话人识别作为一种生物识别技术，能够根据测试语音来辨别说话者的身份。本文针对实时性问题提出了一种以FPG

17 2020-10-27
基于DTW的编码域说话人识别研究

相对解码重建后的语音进行说话人识别,从VoIP的语音流中直接提取语音特征参数进行说话人识别方法具有便于实现的优点,针对G.729编码域数据,研究基于DTW算法的快速说话人识别方法。实验结果表明,在相关

10 2020-10-28
说话人识别中语速鲁棒性研究

如今,说话人识别技术已经比较成熟,但依然有很多因素影响说话人识别系统的稳定性。本文针对说话速度对说话人识别的影响进行了一系列的研究工作。通过模型空间分布可视化和语音频谱观察两方面来分析不同语速语音的差

14 2020-10-27
语音识别中的说话人自适应研究

语音识别

19 2020-09-01
基于PCA与LDA的说话人识别研究

基于PCA与LDA的说话人识别研究，仅供需要的人员参考！

36 2019-09-09
基于SOPC的说话人识别控制器

SOPC 说话人识别语音识别算法论文有助于从事语音识别行业的从业人士

11 2019-01-13

期限项目:多说话者识别 源码

文件列表

用户评论

推荐下载

期限项目:多说话者识别源码