我做的一些工具与项目,大多围绕实时语音 AIAI 编程工作流开发者效率。每个都可以点开看代码,部分有在线体验。

🛠 开发者工具

1086+ 纯前端在线工具集 —— 单文件、零构建、可离线、隐私优先。

前端工具集离线

Obsidian 侧边栏里的全功能终端 —— 直接跑 Claude / Gemini CLI、vim、git。

ObsidianAI CLI插件

现代化的 Claude Code 桌面客户端,基于 Tauri 2.0 + Vue 3 构建。

TauriVue桌面应用

扫描多仓库的 .env,用 SOPS + age 加密同步进一个 Git vault 的 CLI。

CLI加密DevOps

隐私优先的浏览器起始页 —— 玻璃拟态设计,快捷链接 / 待办 / 倒计时,单文件 HTML。

前端单文件

🎙 语音 · AI

AI 语音生成与克隆平台 —— 200+ 音色,文本转语音、配音视频、AI 播客一站搞定。

语音克隆TTS产品

实时 AI 语音对话平台 —— 基于 WebSocket 的流式 STT / LLM / TTS。

语音WebSocket流式

离线语音识别 + 说话人分离 —— Whisper ASR + MCP server,纯本地、不上云。

ASRMCP离线

CosyVoice 的生产级异步 TTS 接口 —— 简化封装,开箱即用。

TTSPython

腾讯云的 OpenAI 风格 TTS SDK —— 简洁、优雅、多语言。

TTSSDK

AI 语音内容生成平台 —— 用文本转语音做播客、有声书、配音。

TTS内容生成

⚙️ 基础设施

轻量 Go 流式中继 —— 面向 LLM / TTS API,带生产级可观测性与策略控制。

Go流式可观测性

开源云媒体处理引擎 —— 声明式任务 → 确定性 FFmpeg 流水线 → 进度 / 日志 / 产物。

GoFFmpeg媒体处理

极简的多平台媒体下载 REST API —— 支持 YouTube / B站 / TikTok / 抖音等。

APIPython

更多项目见我的 GitHub →