Text_to_Speech:深度学习和Google翻译的结合可将手写文本转换为音频输出源码

competence_33236 8 0 ZIP 2021-04-07 07:04:48

文字转语音深度学习和Google翻译的结合,可将手写文本转换为音频输出。该项目将记录在案的手写文本作为输入,并以108种不同语言的音频格式提供翻译后的输出。该项目的主干是手写文本检测模型,该模型使用RESNET50上的转移学习进行了训练。该模型的输入来自上可用的数据集与MNIST数据集的组合,所有图像均调整为(32,32)。经过训练的图像总数为4,42,451。该模型在SGD优化器上训练了50个纪元,记录的训练和验证准确性分别为96.53%和96.81%。每个字符的分类报告: 该模型在Tensorflow 2.1.0和OpenCV 4.2.0上进行了训练。训练后的模型文件位于

文件列表

Text_to_Speech-main.zip (预估有个17文件)

Text_to_Speech-main

training plot.png 18KB

data

__init__.py 110B

datasets.py 1KB

test images

ocr.png 11KB

final.png 166KB

saved_sounds

Translated-2021-02-21-12-30.mp3 116KB

README.md 1KB

Text-to-speech.ipynb 16KB

Trained Model

model.h5 1.52MB

Classification Report.PNG 27KB

resnet

__init__.py 58B

resnet.py 4KB

Result Images

OCR

Translated Text.PNG 18KB

OCR Detection.PNG 17KB

Handwritten

Handwritten text detection.PNG 227KB

Accuracy of words.PNG 7KB

Model Training and Saving.ipynb 96KB

用户评论

暂无评论

机器学习NLP文本挖掘深度学习源码

机器学习--- NLP ---文本挖掘---深度学习

23 2021-02-17
TinyPDF可将文档或网页模拟打印转换为pdf

TinyPDF(可将文档或网页通过模拟打印转换为pdf)

13 2020-05-15
多页面笔记本可将文字转换为声音

可以将文字转换为声音输出。输出为wav文件。

23 2019-01-21
大众听书文本转换为语音的软件

大众听书是一款将文本转换为语音的软件，能自动识别GBK和Unicode编码的中文，转换结果还可以保存为Wav文件。因仅使用了自带8K码率的语音库，朗读效果相当于小学三年级学生的水平，但用来校对文稿和看

31 2018-12-08
图片上的文字转换为TXT文本

JOCR是一个可以辨识图片里的文字并存成文字文件的免费软件。不管你是用扫瞄器扫出来的图文件或是数字相机拍起来的相片，只要里面有文字，都可以利用JOCR来辨识并储存成真正的文字文件，如此一来就可以随意编

44 2019-01-07
Python文本转换为语音的代码示例

下面是一个简单的Python代码示例，可以将文本转换为MP3音频文件。这个代码使用了一个开源的Python库，它使用Google Text-to-Speech API将输入的文本转换为语音，并将其保存

6 2023-07-24
PhpChromeToPdf围绕Google chrome的超薄PHP包装器可将url转换为pdf或获取屏幕截图易于使用和清洁OOP界面源码

PHP的ChromeToPdf PHP ChromeToPdf提供了一个简单干净的界面,可简化使用创建PDF和图像的过程。您必须在系统上安装Google Chrome并可以使用它。有关详细信息,请

7 2021-02-22
信息检索基于知识图谱和深度学习的文本表示和搜索Explicit and distributed semantics for text representat

信息检索:基于知识图谱和深度学习的文本表示和搜索(Explicit and distributed semantics for text representation and retrieval)-附

4 2021-03-18
TensorFlow实战Google深度学习框架的书籍源码

TensorFlow实战Google深度学习框架的书籍源码

29 2019-04-30
文本到图像将文本转换为灰度图像并返回源码

文字转图片轻松将文本转换为灰度图像,反之亦然。使用此工具,您可以将文本或纯文本文件编码为灰度图像,以方便共享。每个像素代表一个字符的十进制值。解码图像时,您可以直接将文本解码到控制台或纯文本文

58 2021-02-06

Text_to_Speech:深度学习和Google翻译的结合可将手写文本转换为音频输出 源码

文件列表

用户评论

推荐下载

Text_to_Speech:深度学习和Google翻译的结合可将手写文本转换为音频输出源码