TensorflowASR:集成了Tensorflow 2版本的端到端语音识别模型并且RTF(实时率)在0.1左右Tensorflow 2中最先进的自动语音识别
TensorflowASR 集成了Tensorflow 2版本的端到端语音识别模型,和RTF(实时率)在0.1左右 目前集成了中文的CTC \ Transducer \ LAS三种结构 当前还在开发阶段 欢迎使用并反馈bug |中文版 梅尔层 参照librosa库,用TF2实现了语音频谱特征提取的层,这样在跨平台部署时会更加容易。 使用: am_data.yml use_mel_layer: True mel_layer_type: Melspectrogram #Spectrogram trainable_kernel: True #support train model,not rec
文件列表
TensorflowASR:集成了Tensorflow 2版本的端到端语音识别模型,并且RTF(实时率)在0.1左右Tensorflow 2中最先进的自动语音识别
(预估有个108文件)
.gitignore
97B
newfolder
1B
LICENSE
11KB
community.jpg
152KB
README_en.md
9KB
README.md
9KB
pinyin2phone.map
17KB
AM.h
308B
VoxCommon.hpp
1KB
AudioFile.hpp
41KB
暂无评论