移花宫资源网 Design By www.nbddc.com
可实现本地电脑的音频转文字软件!双向转换,完全免费开源!支持 Windows、macOS、Linux
(目前界面只有英文的,但支持中文的转换)
特征
- 基于 DirectCompute 的供应商不可知的 GPGPU;该技术的另一个名称是“Direct3D 11 中的计算着色器”
- 纯 C++ 实现,除了基本的 OS 组件外没有运行时依赖性
- 比 OpenAI 的实现快得多。
- 混合 F16 / F32 精度:自 D3D 版本 10.0 起,Windows [color=var(--color-accent-fg)]需要缓冲区 的支持R16_FLOAT
- 内置性能分析器,可测量单个计算着色器的执行时间
- 内存使用率低
- 用于音频处理的媒体基础,支持大多数音频和视频格式(Ogg Vorbis 除外),以及大多数在 Windows 上运行的音频捕获设备(除了一些专业的,它们只实现 ASIO API [color=var(--color-accent-fg)]。
- 用于音频捕获的语音活动检测。
使用步骤:
下载 WhisperDesktop.zip、ggml-medium 语音模型(官方那里有好多规格如图一,作者推荐1.42G这个模型,下面百度云盘下载链接)
图一
解压WhisperDesktop.zip,打开WhisperDesktop.exe,首先选择要加载的语音模型
加载完成后,就可以进行语音转文了
转换的过程如下图:
结果以文本格式输入。
另外一个功能是允许从麦克风捕获和转录或翻译实时音频
gui-capture.png
ggml-medium 语音模型(官方):
https://huggingface.co/datasets/ggerganov/whisper.cpp/tree/main
作者推荐ggml-medium.bin(大小为 1.42GB)
链接:https://pan.baidu.com/s/1xcemqdg_H5OWMlDx4hzcuQ?pwd=fk2d
提取码:fk2d
蓝奏下载(最小的体验包):https://wwnn.lanzoue.com/iZVcM0wq5lvg 密码:7go1
Whisper :开源项目(官方)
https://github.com/Const-me/Whisper
蓝奏下载 :https://wwnn.lanzoue.com/iDT010wq4q6f 密码:57ko
移花宫资源网 Design By www.nbddc.com
广告合作:本站广告合作请联系QQ:858582 申请时备注:广告合作(否则不回)
免责声明:本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除!
免责声明:本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除!
移花宫资源网 Design By www.nbddc.com
暂无评论...
更新日志
2024年05月17日
2024年05月17日
- [In-Akustik7506]ReferenceSoundEdition-GreatWomenOfSong(2014)HQCD[WAV+CUE]
- 日本EMI超级名盘TOGE-11035-36BeethovenFidelio-Furtwngler
- 宝丽金50周年2010《古典篇》3CD限定盘[低速原抓WAV+CUE]
- 华纳群星.1992-永远新一天华纳15周年金钻群星演唱会2CD【华纳】【WAV+CUE】
- 原声《功夫熊猫4 OST》[FLAC][545M]
- 陈奕迅《酝酿》[WAV分轨][502M]
- Taylor Swift《THE TORTURED POETS DEPARTMENT- THE ANTHOLOGY》[320K/MP3][279.09MB]
- 崔健《85回顾+梦中的倾诉》2CD [WAV+CUE][771M]
- 群星《安桥试音碟》3CD[FLAC][1.1G]
- Taylor Swift《THE TORTURED POETS DEPARTMENT- THE ANTHOLOGY》][24bit 48kH][FLAC/分轨]
- 群星1995-阿诗玛·中国歌剧金曲[中唱][WAV+CUE]
- [JVC]吴文光-中国古琴:流水[FLAC分轨]
- 刘欢.2004-经典20年珍藏锦集【新索】【WAV+CUE】
- 中唱唱片群星《好歌珍藏-游子情深》2CDWAV
- CD圣经上榜天碟1995-乌仁娜-《蒙古草原之歌》[WAV+CUE].