- Видео 23
- Просмотров 25 247
理想拖
Тайвань
Добавлен 7 сен 2020
一名算法工程师,致力于探索并分享 AI 技术、开源工具及有趣的项目。
1summary:支持自定义 API 的一键网页总结插件
推一个结合 cursor 开发的一键网页总结插件。
- 插件支持自定义 API 服务商、模型、提示模板等参数,具备生成结果缓存和一键复制功能。
- 模型推荐使用 deepseek-chat、Groq 和 sambanova 的 Llama 3.1 系列。
#chatgpt #chrome #groq #sambanova
---
资源及链接:
- GitHub 项目地址:github.com/ultrasev/1summary
- Groq API doc: console.groq.com/docs/quickstart
- sambanova API doc: cloud.sambanova.ai/apis
- 插件支持自定义 API 服务商、模型、提示模板等参数,具备生成结果缓存和一键复制功能。
- 模型推荐使用 deepseek-chat、Groq 和 sambanova 的 Llama 3.1 系列。
#chatgpt #chrome #groq #sambanova
---
资源及链接:
- GitHub 项目地址:github.com/ultrasev/1summary
- Groq API doc: console.groq.com/docs/quickstart
- sambanova API doc: cloud.sambanova.ai/apis
Просмотров: 57
Видео
语音合成新秀 fish.audio,语音合成效果可媲美 ChatTTS,轻松完成音色克隆。
Просмотров 5902 месяца назад
由多位知名 TTS 开源项目作者联合创建的 fish.audio 近期上线,目前开放注册,免费使用。 fish.audio 提供多种热门声音模型,包括丁真、特朗普、董宇辉等,以及诸多二次元人物。用户也可上传音频文件训练自己的模型,体验独有的语音合成效果。 视频里演示了丁真和特朗普的合成声音,同时简要分析一下fish.audio目前的小问题。 注:本视频里的的音频即通过 fish.audio 生成,使用的模型是单田芳老师的声音模型。 #fishaudio #语音合成 #ai #语音克隆 #开源项目 #github #tts #chattts #audio 时间戳 : 0:00 - 简要介绍 fish.audio 这个平台 1:02 - fish.audio 的功能介绍 2:37 - 语音合成的效果演示,使用丁真和特朗普的声音模型,分析合成效果 3:55 - 模型效果的一些瑕疵的分析 资...
做了一个命令行小工具,用 GPT 自动生成 Git 提交信息,完善 git 仓库代码管理
Просмотров 1523 месяца назад
做了一个微小的命令行小工具: aicommit,利用 AI 模型自动生成 Git 提交信息,提升代码管理效率。 #git #ai #代码管理 #gpt #gemini #开源项目 时间戳 : 0:00 - 为什么要做这个小工具 1:17 - 实际使用体验,aicommit 整个项目的 commit 信息都是通过 GPT 自动生成的 2:01 - 小工具实现原理 4:20 - pip 安装与使用 资源及链接: - aicommit 项目地址:github.com/ultrasev/aicommit - Git commit 规范参考: github.com/o-w-o/way/blob/master/appendixs/wiki/git-commit.md - 基于 cloudflare worker 的 LLM API 反向代理项目: github.com/ultrasev/llmp...
这次用 ChatTTS 生成了一段全英文的音频,还是同一个音色。
Просмотров 3073 месяца назад
固定音色后,用 ChatTTS 生成了一段全英文的音频。 生成的语音总体感觉还是挺自然的,基本的语音节奏和音调都是对的。 就是情绪不太好调,有时候热情洋溢,有时候出来的音频有点冷淡。 脚本内容是结合 ChatGPT 生成改造的。 #ChatTTS #文本到语音 #pip 安装 #Docker 部署 #Python #TTS #语音合成 资源及链接: - pip 及 docker 部署:github.com/ultrasev/ChatTTS - yihong0618 的 fork:github.com/yihong0618/ChatTTS - 视频中的 Google colab 链接:colab.research.google.com/drive/1dEbafJ9fjaXjdbNrOlqNSVFlM_I4K55a?usp=sharing
大家再感受一下,ChatTTS 是可以固定音色的。这里还有 pip 一键安装和 Docker 部署方案。
Просмотров 6 тыс.3 месяца назад
通过设置 `sample_random_speaker` 的随机种子,这次 ChatTTS 生成的音频的音色不随机了,稳稳的固定在一个音色上。 这里还有一个 pip 一键安装的方法,以及 Docker 部署的方式。 #ChatTTS #文本到语音 #pip安装 #Docker部署 #Python库 #语音合成 #tts 资源及链接: - pip 及 docker 部署:github.com/ultrasev/ChatTTS - yihong0618 的 fork:github.com/yihong0618/ChatTTS - 视频中的 Google colab 链接:colab.research.google.com/drive/1Eqxn3-aXXxAqJ7EYA2elpOHsXRPEbUlZ?usp=sharing 联系我: slippertopia
有点厉害,来感受一下 ChatTTS 这个语音合成(TTS)模型
Просмотров 6 тыс.4 месяца назад
#ChatTTS 是一个专门为对话场景设计的 #tts 项目,支持中英文语音生成,开源两天已获 4,000 stars。 模型使用 10 万小时的中英文数据训练,生成的语音自然流畅,语调语气非常接近真人说话模式。 #ChatTTS #语音生成 #开源项目 #tts 资源及链接: - ChatTTS GitHub 项目地址:github.com/2noise/ChatTTS - 视频中的 Google colab 链接:colab.research.google.com/drive/1_Ma1BXvIrYw9kO4UYsSG4GaFkttbS1wY?usp=sharing
搭了一个 AIGC 小破站,聚合一些 AI 生成的高质量图片
Просмотров 1254 месяца назад
使用 #cloudflare (worker r2 d1) 搭建部署了一个图片聚合站,都是一些 AI 生成的高质量图片,可以用来做壁纸,也可以用来做设计素材。 - 图片无水印,无版权,可以随意使用。 - 网站 UI 简单,只有一个图片展示及下载功能。内容是随机展示的,每次刷新都会有新的图片。另外还提供两个额外的下载接口,倾向于使用脚本下载的用户可以体验一下。 - 如果展示不出来,可能是网络问题,可以多刷新几次。 - 理论上可以无限下滑,但是图片存量有限的,可能滑着滑着就滑不动了。休息一下,改天再来看看。 站点地址:art.ultrasev.com/about #aigc #art #cloudflare
如何使用 FastAPI 在 Vercel 上部署 API 服务,并实现 Groq API 反向代理
Просмотров 2494 месяца назад
使用 Python(3.9) 及 #fastapi 在 #vercel 上部署一个 API 服务,并结合 #openai 的 Python 库,实现一个 #groq API 的反向代理。 时间戳 : 0:00 - Vercel (Python) 项目模板介绍,配置文件说明 2:15 - 部署 Python 项目到 vercel 上 4:10 - 添加一个新的接口 `/api/random/` 6:24 - 使用 OpenAI 的 Python 库,实现 Groq API 反向代理 资源及链接: - 视频中项目模板:github.com/ultrasev/vercel-python-fastapi - Groq API 使用示例:console.groq.com/docs/quickstart - Vercel 项目构建文档:vercel.com/docs/deployments/co...
【Github项目更新】使用 cloudflare worker 搭建反向代理项目更新,支持通过路由参数指定平台,支持结果缓存,可以在沉浸式翻译插件中直接使用 LLaMA-3 了。
Просмотров 3904 месяца назад
之前在 cloudflare worker 搭建 LLM API 反向代理(ruclips.net/video/rfn3lBC11Dk/видео.html) 中,聊了怎么使用 cloudflare worker 实现 AI 模型 API 的反向代理,支持平台 #openai 、#gemini (Google) 及 #groq 。 本次主要更新有: 1. 添加新版本接口,支持通过路由参数指定平台(OpenAI, Groq etc.),可结合 chatbot,沉浸式翻译插件等工具使用。 2. 支持缓存结果,短期内相同请求会直接读取缓存数据,提升响应速度,并节省 token 数。 0. 思考了人生的意义,发现了 42。 代码已更新到 GitHub(github.com/ultrasev/llmproxy),具体使用示例可参考项目文档。欢迎社区反馈与建议。 #cloudflare #api...
【提升效率神器】Kimi Copilot 插件推荐:一键总结文章、视频和 PDF,快速掌握内容要点,Chrome 用户必备
Просмотров 1,6 тыс.4 месяца назад
推荐一款基于 Kimi Chat 的 Chrome 网上冲浪助手插件 Kimi Copilot 。可以一键总结网络文章、视频内容和 PDF 文档,帮助使用者快速获取信息要点,大幅提高阅读和学习效率。 #chrome插件 #内容总结 #效率 #博客 #kimi #copilot 时间戳 : 0:00 - Kimi Copilot 插件介绍 3:04 - 使用 Kimi Copilot 对博客文章进行内容总结 4:28 - 使用 Kimi Copilot 对 RUclips 视频进行内容总结 6:30 - 使用 Kimi Copilot 对 PDF 文档进行内容总结 资源及链接: - Kimi Copilot 插件地址:bit.ly/3URw8su
【教程】使用 Cloudflare Worker 搭建反向代理,本地通过 API 直接调用 GPT、Gemini、Llama3 等语言模型
Просмотров 1,8 тыс.5 месяцев назад
本期聊一下如何使用 cloudflare worker 搭建一个反向代理,无需魔法即可调用 OpenAI, Google, Groq 等平台的 LLM API。 - Github 仓库:github.com/ultrasev/llmproxy - Demo API: llmapi.ultrasev.com, 长期有效 #cloudflare #llm #gpt #bard #llama3 #groq
[UPDATE]: 伪实时语音转写项目 stream whisper 的一点更新
Просмотров 3035 месяцев назад
对之前的开源项目 stream #whisper 做了一点小的改进: Improvement: 1. 解耦录音和转写模块,现在可以持续录音,不用等待之前语音转写完成; 2. 增加静音内容检测,过滤无效音频,基本上不会再出现无效音频被转写出文本的情况。 New: 1. 制作了 docker 一键部署 FastWhisper 的镜像,接口兼容 #openai 的 API 规范; - stream-whisper github 仓库: github.com/ultrasev/stream-whisper - 公益转写测试接口信息: pb.ddot.cc/mszd2f - 一键部署 FastWhisper 的 docker 镜像: ghcr.io/ultrasev/whisper
【开源项目推荐】ChatGPT 免登录实现 API 调用,一键部署 FreeGPT API 服务
Просмотров 8625 месяцев назад
本期介绍一个将 #chatgpt 网页版转换成 API 的开源项目 #FreeGPT35,项目是通过逆向前几天完全开放的 #chatgpt 3.5 实现的。支持调用的模型是 text-davinci-002,可以实现对话、生成文本等功能。 - 项目地址:github.com/missuo/FreeGPT35 - 一键部署到 Vercel 上的项目地址:github.com/cliouo/FreeGPT35-Vercel #freegpt #chatgpt #api #docker
【开源项目推荐】WeWe-RSS:更优雅的微信公众号订阅方式,一键部署公众号私有化RSS订阅服务
Просмотров 6325 месяцев назад
本期内容推荐一个 #github 上的微信公众号开源项目 wewe-rss,支持通过 #rss 方式获取公众号文章,支持私有化部署。实现方式是通过微信读书获取订阅号内容,只要官方不出手,就能一直稳定运行。 wewe-rss github: github.com/cooderl/wewe-rss
【开源项目推荐】 kimi free API - 月之暗面网页 AI 聊天功能封装成 API
Просмотров 7106 месяцев назад
这是一个 API #wrapper,封装了 #月之暗面 #ai 网页聊天版。支持高速流式输出、支持多轮对话、支持联网搜索、支持长文档解读、支持图像解析,零配置部署,多路 token 支持,自动清理会话痕迹。 #Kimi 对长文本的支持能力非常强,最高支持 20 万字的输入,感兴趣的小伙伴们不要错过。 #chatgpt #llm - Kimi 官网 kimi.moonshot.cn/ - kimi-free-API 项目:github.com/LLM-Red-Team/kimi-free-api
【评测】简单评测一下 Google Gemini 1.5 Pro 模型的能力
Просмотров 2166 месяцев назад
【评测】简单评测一下 Google Gemini 1.5 Pro 模型的能力
【教程】使用 whisper 进行语音转写部署详细教程,借助 Colab GPU,轻松实现语音转文字
Просмотров 4887 месяцев назад
【教程】使用 whisper 进行语音转写部署详细教程,借助 Colab GPU,轻松实现语音转文字
油管一个频道主称用whisper实现了“零延迟”语音转写,真的可能吗?🤔️
Просмотров 3568 месяцев назад
油管一个频道主称用whisper实现了“零延迟”语音转写,真的可能吗?🤔️
如何用 faster-whisper 做一个超低延迟语音聊天机器人
Просмотров 1,7 тыс.8 месяцев назад
如何用 faster-whisper 做一个超低延迟语音聊天机器人
【AI语音转写】打造免费高效语音转写服务,OpenAI whisper 模型部署教程,中英文效果俱佳
Просмотров 4538 месяцев назад
【AI语音转写】打造免费高效语音转写服务,OpenAI whisper 模型部署教程,中英文效果俱佳