阿里开源视频自动化剪辑工具FunClip 支持中文语音识别、传媒热点、传媒资讯、苏州钰尚传媒-商业品牌企业运营服务商

苏州钰尚传媒-商业品牌企业运营服务商-专业高端视频拍摄服务、商业品牌宣传片制作、企业产品广告片TVC微电影拍摄、活动会议跟拍、AI视频短剧制作、纪录专题片拍摄、媒体宣传发布推广、品牌宣传软文发布、苏州广告标识牌设计制作、钰尚文化传媒——合作咨询联系微信：esay8168 ,联系：电话18888186853微信同号

合作咨询

QQ：

微信：esay8168

扫微信二维码

联系

电话18888186853微信同号

联
系
我
们

这里是文章模块栏目内容页

阿里开源视频自动化剪辑工具FunClip 支持中文语音识别

irfjbf5412

2024-05-13 18:36:29

站长之家（ChinaZ.com）5月13日消息:阿里巴巴通义实验室最近开源了一款名为FunClip的视频自动化剪辑工具，专为精准和便捷的视频切片设计。FunClip能够自动识别视频中的中文语音，并允许用户根据语音内容裁剪视频，大大提高了视频编辑的效率。

项目地址:https://github.com/alibaba-damo-academy/FunClip

在线演示:https://modelscope.cn/studios/iic/funasr_app_clipvideo/summary

FunClip的主要特点

语音识别:使用阿里巴巴的FunASR Paraformer-Large模型，确保了剪辑的精准性。
操作简便:用户可以根据识别的语音内容选择文本片段或说话人进行视频裁剪。
语言支持:目前支持中文，未来将扩展支持英文视频剪辑。

FunASR工具包介绍

FunASR是阿里巴巴通义实验室开发的一款综合性语音识别工具包，提供端到端的语音识别解决方案和一系列开源的、性能优越的预训练模型。它支持以下功能:

语音识别（ASR）:提供非自回归端到端语音识别模型，支持多任务处理。

语音活动检测（VAD）与标点恢复:通过预训练模型进行有效的语音活动区段检测，提供标点恢复功能。

模型动态部署与优化:支持预训练模型的微调和推理，提供文件转录和实时转录服务。

项目地址:https://github.com/alibaba-damo-academy/FunASR

论文:https://arxiv.org/abs/2305.11013

Paraformer模型

Paraformer是阿里巴巴达摩院语音团队开发的非自回归端到端语音识别模型，专为高效的GPU并行推理设计。它提供快速且准确的语音到文本的转换，特别适合处理长音频。Paraformer模型的核心特点包括:

高效的模型架构:采用多种网络结构和优化目标，提供高效率和准确度。

功能拓展:支持热词定制版模型和长音频模型，适用于多种应用场景。

应用场景:适用于语音输入法、语音导航、智能会议纪要等多种应用场景。

FunClip的开源为视频内容创作者和编辑者提供了一个强大的工具，使得视频剪辑更加智能化和自动化。同时，FunASR工具包和Paraformer模型的开源，也为语音识别领域的研究和应用提供了宝贵的资源。阿里巴巴通过这些开源项目，展示了其在AI技术领域的领导地位和对开放创新的承诺。

Paraformer模型地址:https://modelscope.cn/models/iic/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-pytorch/summary

（）

（来源：站长之家）

免责声明：本站文章部分内容为本站原创，另有部分容来源于第三方或整理自互联网，其中转载部分仅供展示，不拥有所有权，不代表本站观点立场，也不构成任何其他建议，对其内容、文字的真实性、完整性、及时性不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容,不承担相关法律责任。如发现本站文章、图片等内容有涉及版权/违法违规或其他不适合的内容，请及时联系我们进行处理。

有帮助

上一篇：支持游玩索尼 PS1 游戏，Gamma 模拟器上架苹果 App Store

下一篇：高通骁龙X二代、三代首曝！两年一个脚印

栏目索引

友情链接

传媒行业的商业全面服务与您共创美好未来

合作共赢

交互式网络传媒领域
资源丰富，体系完善
创造更加精准、有效的，线上线下互动品牌整合服务
多年传媒行业尽管，见证品牌及产品的蜕变、递增和成长

创造优势

苏州钰尚传媒-商业品牌企业运营服务商最新资讯

致力于传媒行业领域的专业公司

最新文章

标签云

友情链接

小鹏MONA L03...

出生7天小马被游客无...

解锁咖啡软文代发技巧...

一站式广告装修全包服...

友情链接