一周万星的文本转语音开源项目「GitHub 热点速览」

github · 浏览次数 : 0

小编点评

本文为GitHub上的热门开源项目概述,涉及对话式文本转语音模型、屏幕录制工具、在线办公套件等领域。 1. 对话式文本转语音模型:ChatTTS 简介:专为用户交互场景设计的文本转语音模型,具备自然流畅的语音生成能力,可控制和添加多种声音元素。 链接:https://github.com/2noise/ChatTTS 2. 轻松的 macOS 屏幕录制工具:QuickRecorder 简介:一款免费且功能丰富的 macOS 屏幕录制工具,提供多种录屏模式,便于用户进行便捷的操作。 链接:https://github.com/lihaoyun6/QuickRecorder 3. 免费的在线办公套件:Unive 简介:集成类似Google文档、幻灯片及表格功能的 TypeScript 在线办公套件,富文本、表格公式等功能的完美支持。 链接:https://github.com/dream-num/unive 4. 清新优雅的管理后台模板:soybean-admin 简介:采用Vu3、Vite5、Pinia及UnoCSS等前沿技术打造的现代化管理后台模板,提供干净整洁的项目结构和国际化解决方案。 链接:https://github.com/soybeanjs/soybean-admin 5. 图像生成功能简化工具:Omost 简介:基于LLM编程能力的图像生成功能工具,允许用户借助简短的提示词创建高质量的图片,降低编写图像生成功能的门槛。 链接:https://github.com/lllyasviel/Omost 此外,GitHub还公布了本周的热门开源项目,包括在Windows任务栏展示小猫动画的工具RunCat_for_windows以及美观实用的终端文件管理器superfile,进一步丰富了开源世界的多样性。

正文

上周的热门开源项目让我想起了「图灵测试」,测试者在不知道对面是机器还是人类的前提下随意提问,最后根据对方回复的内容,判断与他们交谈的是人还是计算机。如果无法分辨出回答者是机器还是人类,则说明机器已通过测试,具有人类的智力水平。

​虽然现在大模型的回答还充满 AI “味”,可以一眼识破,但 GitHub 上有个开源项目:ChatTTS,它根据文本生成的语音,已经可以做到“以假乱真”,不单单是我这么觉得,一周飙升了 1w+ Star,已经足以说明大家对它的认可。

作者为了限制 ChatTTS 生成的语音,在 4 万小时模型的训练过程中添加了少量额外的高频噪音,并尽可能压缩了音质,让其更好分辨出来,从而防止不法分子用它进行诈骗等违法行为,看来生成效果已经好到作者自己都“害怕”的地步了😅

还有位开发者(lihaoyun6)因为看不惯 macOS 的录屏软件收费,就自己动手做了一个轻巧的 macOS 屏幕录制工具:QuickRecorder,它不仅功能齐全还免费开源。如果你觉得自己桌面有点单调,这有个小工具(RunCat_for_windows)可以在任务栏上显示一只奔跑的小猫,它会陪着你一起加班或写代码。文生图的效果很看提示词的质量,Omost 让你仅需一条极简的描述就能生成一张细节满满的图片,比如“一个有趣的卡通蝙蝠侠与小丑战斗”。

最后,推荐一个用当下最新的前端技术栈构建的管理后台模版:soybean-admin 和一个非常漂亮的终端文件管理器:superfile

  • 本文目录
    • 1. 开源新闻
      • 1.1 强大的对话式文本转语音模型:ChatTTS
    • 2. 开源热搜项目
      • 2.1 直接使用 ChatTTS 的 WebUI:ChatTTS-ui
      • 2.2 轻巧的 macOS 屏幕录制工具:QuickRecorder
      • 2.3 开源的在线办公套件:Unive
      • 2.4 清新优雅的管理后台模板:soybean-admin
      • 2.5 极简提示词的文生图工具:Omost
    • 3. HelloGitHub 热评
      • 3.1 在 Windows 任务栏飞奔的“小猫”:RunCat_for_windows
      • 3.2 非常漂亮的终端文件管理器:superfile
    • 4. 结尾

1. 开源新闻

1.1 强大的对话式文本转语音模型:ChatTTS

该项目是专门为对话场景设计的文本转语音模型,支持中、英双语。它不仅能够生成自然、流畅的语音,还能控制和添加笑声、停顿和语气词等。ChatTTS 生成较短的语音效果很好,几乎听不出 AI “味”。

import ChatTTS
from IPython.display import Audio

chat = ChatTTS.Chat()
chat.load_models(compile=False) # 设置为True以获得更快速度

texts = ["在这里输入你的文本",]

wavs = chat.infer(texts, use_decoder=True)

torchaudio.save("output1.wav", torch.from_numpy(wavs[0]), 24000)

GitHub 地址→github.com/2noise/ChatTTS

2. 开源热搜项目

2.1 直接使用 ChatTTS 的 WebUI:ChatTTS-ui

主语言:PythonStar:2.1k周增长:2k

该项目为 ChatTTS 提供了开箱即用的本地网页界面,可以直接在本地浏览器中使用 ChatTTS,支持文字合成语音、中英文、数字混杂等功能,并提供了 API 接口。

GitHub 地址→github.com/jianchang512/ChatTTS-ui

2.2 轻巧的 macOS 屏幕录制工具:QuickRecorder

主语言:SwiftStar:2.6k周增长:500

这是一个用 SWiftUI 编写、仅 10MB 的 macOS 屏幕录制工具,它只为做好录屏这一件事,不仅免费且功能丰富,支持窗口录制、应用录制、录制移动设备、窗口声音内录、鼠标高亮、隐藏桌面文件等功能。

GitHub 地址→github.com/lihaoyun6/QuickRecorder

2.3 开源的在线办公套件:Unive

主语言:TypeScriptStar:5.1k周增长:1k

这是一个功能丰富、易于集成的在线办公套件,它提供了类似 Google 文档、幻灯片(开发中)和表格的功能,支持富文本、表格公式、数据验证、国际化等功能。

GitHub 地址→github.com/dream-num/unive

2.4 清新优雅的管理后台模板:soybean-admin

主语言:TypeScriptStar:8.3k周增长:300

该项目是采用 Vu3、Vite5、Pinia 和 UnoCSS 等技术栈构建的管理后台模板,它不仅拥有漂亮的界面,还有清晰的项目结构、严格的类型检查、统一的代码规范,内置丰富的主题配置、国际化方案、页面组件,并且支持移动端。

GitHub 地址→github.com/soybeanjs/soybean-admin

2.5 极简提示词的文生图工具:Omost

主语言:PythonStar:2.6k周增长:2k

该项目基于 LLM 的编程能力帮用户自动完善文生图的提示词,可以根据用户输入的简短提示词生成高质量的图片,还支持图片局部修改等功能,比如将图片中的龙变成恐龙,极大地降低了编写文生图的门槛,无需复杂的提示词即可生成满意的图片。

GitHub 地址→github.com/lllyasviel/Omost

3. HelloGitHub 热评

在这个章节,将会分享下本周 HelloGitHub 网站上的热门开源项目,欢迎与我们分享你上手这些开源项目后的使用体验。

3.1 在 Windows 任务栏飞奔的“小猫”:RunCat_for_windows

主语言:C#

这是一个用 C# 写的小工具,它会在 Windows 任务栏显示一只奔跑的小猫动画,CPU 使用率越高它跑得越快。

项目详情→hellogithub.com/repository/7c37c2e3bf3142e7bf5891f5070e3606

3.2 非常漂亮的终端文件管理器:superfile

主语言:Go

这是一个现代终端文件管理器,为命令行文件操作提供了一个直观且漂亮的界面。它默认采用 Vim 风格的快捷键操作,还支持插件和主题自定义。

项目详情→hellogithub.com/repository/d791057ece4f4662be25202c21405a27

4. 结尾

以上就是本期「GitHub 热点速览」的全部内容,希望你能够在这里找到自己感兴趣的开源项目,如果你有其他好玩、有趣的 GitHub 开源项目想要分享,欢迎来 HelloGitHub 与我们交流和讨论。

往期回顾

与一周万星的文本转语音开源项目「GitHub 热点速览」相似的内容:

一周万星的文本转语音开源项目「GitHub 热点速览」

上周的热门开源项目让我想起了「图灵测试」,测试者在不知道对面是机器还是人类的前提下随意提问,最后根据对方回复的内容,判断与他们交谈的是人还是计算机。如果无法分辨出回答者是机器还是人类,则说明机器已通过测试,具有人类的智力水平。 ​虽然现在大模型的回答还充满 AI “味”,可以一眼识破,但 GitHu

微软GraphRAG框架源码解读

两个月前,微软发布了GraphRAG的论文,基于知识图谱技术改进查询聚焦摘要(QFS)任务的问答。7月2日,微软正式官宣GraphRAG项目开源,短短一周破8K星。相信不少小伙伴已经开始着手分析项目的代码和文档了,这里奉上外网薛同学新鲜出炉的源码解读文章,以飨读者。

2023 年该学点什么技术?「GitHub 热点速览 v.23.03」

春节期间,小鱼干读了一篇万字回顾数据库行业的文章,在文字缝隙里我看见了两个词:AI+ 和数据两个词(当然数据是废话,毕竟是一个数据库的回顾文)。在 GitHub 上热点趋势上,可见到 AI+ 的身影,几乎百分之九十迅速蹿红的项目都同 AI 相关。所以在兔年的开头,本期收录一些入门 AI 的项目,希望

[转帖]关于redis,你需要了解的几点!

github:https://github.com/windwant 博客园 首页 新随笔 联系 订阅 管理 随笔 - 227 文章 - 4 评论 - 36 阅读 - 73万 一、关于 redis key: 1、是二进制安全的,也就是说,你可以使用任何形式的二进制序列来作为key,比如一个strin

推荐一个拥有386万订阅者,10000多免费学习视频的频道

自从开始搞YouTube中文配音以来,我们一直是7*24小时,夜以继日的在批量处理一些优质的学习资源,一方面是翻译,另一方面是配音。这样用户在打开的时候,就能获得经过我们优化的翻译和配音了。 这次我们刚刚处理完一个油管上非常火爆的​IT类学习频道:Edureka。 该频道内全是IT行业的免费学习视频

【WebForms王者归来】在 ASP.NET Core 中运行 WebForms 业务代码,99%相似度!

1. 先说结论 我们为 ASP.NET Core 带来了全新的 WebForms 开发模式,可以让 20 年前的 WebForms 业务代码在最新的 ASP.NET Core 框架中运行,代码相似度99%! 一图胜万言! 2. 为什么要升级到ASP.NET Core? 将十几年依赖于 WebForm

学会使用 NumPy:基础、随机、ufunc 和练习测试

NumPy NumPy 是一个用于处理数组的 Python 库。它代表“Numerical Python”。 基本 随机 ufunc 通过测验测试学习 检验您对 NumPy 的掌握程度。 通过练习学习 NumPy 练习 练习: 请插入创建 NumPy 数组的正确方法。 arr = np. ([1,

.NET8中的Microsoft.Extensions.Http.Resilience库

接上一篇,https://www.cnblogs.com/vipwan/p/18129361 借助Aspire中新增的Microsoft.Extensions.ServiceDiscovery库,我们可以很容易的做到服务发现,那么服务节点的熔断限流以及重试等弹性机制.NET是怎么处理的呢? 比如下图

C++ 递归与面向对象编程基础

C++ 递归 递归是一种使函数调用自身的技术。这种技术提供了一种将复杂问题分解为简单问题的方法,从而更容易解决问题。 递归可能有点难以理解。理解其工作原理的最佳方法是通过实验来尝试。 递归示例 将两个数字相加很容易做到,但将一系列数字相加就更复杂了。在下面的示例中,通过将其分解为将两个数字相加的简单

我封装的一个REPR轮子 Biwen.QuickApi

Biwen.QuickApi 项目介绍 [QuickApi("hello/world")] public class MyApi : BaseQuickApi{} 提供一种简单集成的Minimal Web Api交互模块 遵循了 REPR 设计 (Request-Endpoint-