温馨提示:该页面为Windows软件,不支持手机用户安装使用
语音转文字工具是一款实用性强、基于Python编写的应用程序,它集成了图片、视频语音识别和PDF翻译等多种功能。这款工具能够帮助用户轻松实现音频转文字、文字转语音、截图文字识别等操作。
软件亮点
音频转文字:与市面上大多数收费的音频转文字服务不同,这款工具提供免费的音频转文字功能。您只需上传一段音频,即可立即将其识别为文本。这对于会议纪要的制作非常实用,,它不是即时的语音识别。
文字转换语音:转换后的语音听起来自然流畅。
截图文字识别(OCR):您只需进行手机截图,软件即可识别并弹出图片中的文本内容。
批量图片文字识别:选择多张图片,软件可以立即识别出每张图片中的文本。
拷贝翻译:在阅读外文文献时,如果遇到需要翻译的文章段落,您只需进行复制,软件即可实时监测粘贴板并为您提供多种语言的翻译结果。当然对于无法复制的毕业论文等文本,软件还提供了截图OCR功能,并对OCR结果进行翻译。
图片合成:虽然这个功能并不突出,但它满足了用户的个人爱好,将一张图片和一个压缩包合并成一个图片文档,这个图片文档打开后是一张图片,如果将后缀名改为zip,解压后就能看到原来的压缩包。
软件功能
批量音频转文字:您可以批量选择要转换的音频文件,软件将自动识别并转换为文本。这一功能完全免费,识别速度较快,只需耐心等待即可。
例如批量识别小学生课文
例如识别长达五分钟的《荷塘月色》
文字转换语音:输入文本后,您可以挑选发音人、声音速度和声调等选项,并进行试听,最终生成MP3格式的音频文件。
截图OCR:点击截图按钮即可进行截图,软件会自动弹出并识别图片中的文本。
图片批量识别:在截图OCR功能下方,有一个图片批量文字识别功能,属于OCR功能的一部分。您只需批量选择图片,软件即可识别并提取所有图片中的文本。
拷贝翻译:在阅读外文文献时,如果遇到需要翻译的文章段落,您只需进行复制,软件即可实时监测粘贴板并为您提供多种语言的翻译结果。对于无法复制的毕业论文等文本,软件还提供了截图OCR功能,并对OCR结果进行翻译。
图片合成:将一张图片和一个压缩包合并成一个图片文档,这个图片文档打开后是一张图片,如果将后缀名改为zip,解压后就能看到原来的压缩包。
版本更新
添加了免费的音频转文字接口;
免费支持普通话、英语、广东话、四川话识别,虽然速度较慢,但准确度较高。
安装快捷方式
修改或删除您的SD卡中的内容
拥有完全的网络访问权限
控制振动
查看网络连接
开机启动
防止手机休眠
在其他应用之上显示内容
录音
更改您的音频设置
拍摄照片和视频
连接WLAN网络和断开连接
查看WLAN连接
关闭其他应用
卸载快捷方式
让应用始终运行
修改系统设置
检索正在运行的应用
读取您的通讯录
与蓝牙设备配对
访问蓝牙设置
发送持久广播
写入/删除您的通讯录
使用指纹硬件
更改网络连接性
展开/收拢状态栏
查找设备上的帐号
写入/删除您的通讯录
读取同步设置
启用和停用同步
停用屏幕锁定
允许接收WLAN多播
添加或修改日历活动,并在所有者不知情的情况下向邀请对象发送电子邮件
读取日历活动和机密信息
关闭其他应用
请求安装文件包
连接WLAN网络和断开连接
拥有完全的网络访问权限
查看WLAN连接
查看网络连接
访问确切位置信息(以 GPS 和网络为依据)
访问大致位置信息(以网络为依据)
拍摄照片和视频
防止手机休眠
安装快捷方式
开机启动
发送持久广播
控制近距离通信
对正在运行的应用重新排序
读取您的SD卡中的内容