Funasr的speech_seaco_paraformer_large_asr_nat-zh-cn-16k-common-vocab8404-pytorch模型训练

3天前23
Funasr的speech_seaco_paraformer_large_asr_nat-zh-cn-16k-common-vocab8404-pytorch模型训练
之前一直在使用在线流式的语音识别,所以训练的speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-online模型。 要训练speech_seaco_paraformer_large_asr_nat-zh-cn-16k-common-...

通过label-studio标柱FUNasr语音识别模型训练所需的数据

6天前43
通过label-studio标柱FUNasr语音识别模型训练所需的数据
label-studio的安装部署看我的以前的文章 开源模型训练数据标柱工具label-studio使用介绍 - 星光下的赶路人 一、标柱 安装完成后首先上传音频,选择语音识别任务 标注分几步 首先鼠标选中要标柱的音频段,选中后该部分会变成黑色 然后点击上方的标签,一般选择语音s...

PaddleSpeech tts语音合成模型训练

1周前 (09-04)58
PaddleSpeech tts语音合成模型训练
语音合成是指在基础模型上训练自己独有的文本朗读语音。我是在paddlespeech的fastspeech2_aishell3的基础上进行训练。 git地址 paddlespeech的安装及使用请看我之前的文章 ubuntu下安装paddlespeech 通过paddlespeech和ol...

通过QwenCoder+pg数据库实现文本转sql

3周前 (08-21)104
通过QwenCoder+pg数据库实现文本转sql
QwenCoder 是阿里巴巴开源的通义千问系列 AI 编程大模型,可以将文字转换为sql语句,支持MySQL、postgresql等常用的数据库。 以下是我编写的一个测试代码,使用的本地pg库。使用的  XGenerationLab/XiYanSQL-QwenCoder-7B-25...

对funasr微调的模型进行压缩

1个月前 (08-13)181
对funasr微调的模型进行压缩
funasr语音识别模型原本是840M 模型微调后除了模型的权重文件还包括以下内容 训练配置(config)优化器状态(optimizer)学习率调度器状态(scheduler)训练进度(epoch、step 等)随机数种子状态 因此训练后模型变为2.4个G 通过以下代码将训练后的模...

模型训练中的一些名词解释

1个月前 (08-07)200
模型训练中的一些名词解释
一、泛化能力  ​模型在训练数据上学习到的规律和模式,能否有效地应用到未见过的新数据(测试数据或实际应用中的数据)上,并做出准确预测或判断的能力。​​ 用更通俗的话解释:想象你在准备一场考试: ​训练数据​ 就像是你做过的练习题​(你已经看过了题目和答案,进行了学习)。​测试数据​...

FUNASR语音识别模型训练及使用

1个月前 (08-06)377
FUNASR语音识别模型训练及使用
  FunASR是一个基础语音识别工具包,提供多种功能,包括语音识别(ASR)、语音端点检测(VAD)、标点恢复、语言模型、说话人验证、说话人分离和多人对话语音识别等。FunASR提供了便捷的脚本和教程,支持预训练好的模型的推理与微调。       &nbs...

windows11将wsl按章系统移动到其他盘

2个月前 (07-29)229
windows11将wsl按章系统移动到其他盘
C盘快满了,想起来wsl系统都装到C盘了,准备移到D盘去,网上搜的办法太麻烦了,还需要导出再导入,按我的步骤简单几下就可以迁移成功。 查看当前安装有哪些系统 wsl -l 停止当前启动的系统 wsl --shutdown 移动系统到其他盘 wsl --manage Ubuntu-20...

wsl下安装Ubuntu24.04系统以及cuda环境

2个月前 (07-28)185
wsl下安装Ubuntu24.04系统以及cuda环境
1、安装Ubuntu24.04系统 安装wsl请自行搜索教程 打开命令行,执行以下命令安装 wsl --install -d Ubuntu-24.04 查看安装的系统列表 wsl -l 进入到对应的系统 wsl -d Ubuntu-24.04 修改root用户密码 sudo p...

通过paddlespeech和ollama搭建本地语音问答助手

5个月前 (04-14)618
通过paddlespeech和ollama搭建本地语音问答助手
废话不多说,直接开始。 没有安装paddlespeech的查看这个文章安装。ollama的搭建往上有很多教程,直接搜就行,很简单。我使用的 qwen2.5:latest 模型,你也可以切换成其他的,看机器配置。 把下面的代码复制到一个文件夹下面,直接双击浏览器打开index.html文件。...