Funasr的speech_seaco_paraformer_large_asr_nat-zh-cn-16k-common-vocab8404-pytorch模型训练
3天前23
之前一直在使用在线流式的语音识别,所以训练的speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-online模型。 要训练speech_seaco_paraformer_large_asr_nat-zh-cn-16k-common-...
通过label-studio标柱FUNasr语音识别模型训练所需的数据
6天前43
label-studio的安装部署看我的以前的文章 开源模型训练数据标柱工具label-studio使用介绍 - 星光下的赶路人 一、标柱 安装完成后首先上传音频,选择语音识别任务 标注分几步 首先鼠标选中要标柱的音频段,选中后该部分会变成黑色 然后点击上方的标签,一般选择语音s...
PaddleSpeech tts语音合成模型训练
1周前 (09-04)58
语音合成是指在基础模型上训练自己独有的文本朗读语音。我是在paddlespeech的fastspeech2_aishell3的基础上进行训练。 git地址 paddlespeech的安装及使用请看我之前的文章 ubuntu下安装paddlespeech 通过paddlespeech和ol...
通过QwenCoder+pg数据库实现文本转sql
3周前 (08-21)104
QwenCoder 是阿里巴巴开源的通义千问系列 AI 编程大模型,可以将文字转换为sql语句,支持MySQL、postgresql等常用的数据库。 以下是我编写的一个测试代码,使用的本地pg库。使用的 XGenerationLab/XiYanSQL-QwenCoder-7B-25...
对funasr微调的模型进行压缩
1个月前 (08-13)181
funasr语音识别模型原本是840M 模型微调后除了模型的权重文件还包括以下内容 训练配置(config)优化器状态(optimizer)学习率调度器状态(scheduler)训练进度(epoch、step 等)随机数种子状态 因此训练后模型变为2.4个G 通过以下代码将训练后的模...
模型训练中的一些名词解释
1个月前 (08-07)200
一、泛化能力 模型在训练数据上学习到的规律和模式,能否有效地应用到未见过的新数据(测试数据或实际应用中的数据)上,并做出准确预测或判断的能力。 用更通俗的话解释:想象你在准备一场考试: 训练数据 就像是你做过的练习题(你已经看过了题目和答案,进行了学习)。测试数据...
FUNASR语音识别模型训练及使用
1个月前 (08-06)377
FunASR是一个基础语音识别工具包,提供多种功能,包括语音识别(ASR)、语音端点检测(VAD)、标点恢复、语言模型、说话人验证、说话人分离和多人对话语音识别等。FunASR提供了便捷的脚本和教程,支持预训练好的模型的推理与微调。 &nbs...
windows11将wsl按章系统移动到其他盘
2个月前 (07-29)229
C盘快满了,想起来wsl系统都装到C盘了,准备移到D盘去,网上搜的办法太麻烦了,还需要导出再导入,按我的步骤简单几下就可以迁移成功。 查看当前安装有哪些系统 wsl -l 停止当前启动的系统 wsl --shutdown 移动系统到其他盘 wsl --manage Ubuntu-20...
wsl下安装Ubuntu24.04系统以及cuda环境
2个月前 (07-28)185
1、安装Ubuntu24.04系统 安装wsl请自行搜索教程 打开命令行,执行以下命令安装 wsl --install -d Ubuntu-24.04 查看安装的系统列表 wsl -l 进入到对应的系统 wsl -d Ubuntu-24.04 修改root用户密码 sudo p...
通过paddlespeech和ollama搭建本地语音问答助手
5个月前 (04-14)618
废话不多说,直接开始。 没有安装paddlespeech的查看这个文章安装。ollama的搭建往上有很多教程,直接搜就行,很简单。我使用的 qwen2.5:latest 模型,你也可以切换成其他的,看机器配置。 把下面的代码复制到一个文件夹下面,直接双击浏览器打开index.html文件。...