我做的一些工具与项目,大多围绕实时语音 AI、AI 编程工作流和开发者效率。每个都可以点开看代码,部分有在线体验。
🛠 开发者工具
1086+ 纯前端在线工具集 —— 单文件、零构建、可离线、隐私优先。
Obsidian 侧边栏里的全功能终端 —— 直接跑 Claude / Gemini CLI、vim、git。
现代化的 Claude Code 桌面客户端,基于 Tauri 2.0 + Vue 3 构建。
隐私优先的浏览器起始页 —— 玻璃拟态设计,快捷链接 / 待办 / 倒计时,单文件 HTML。
🎙 语音 · AI
AI 语音生成与克隆平台 —— 200+ 音色,文本转语音、配音视频、AI 播客一站搞定。
实时 AI 语音对话平台 —— 基于 WebSocket 的流式 STT / LLM / TTS。
离线语音识别 + 说话人分离 —— Whisper ASR + MCP server,纯本地、不上云。
CosyVoice 的生产级异步 TTS 接口 —— 简化封装,开箱即用。
AI 语音内容生成平台 —— 用文本转语音做播客、有声书、配音。
⚙️ 基础设施
轻量 Go 流式中继 —— 面向 LLM / TTS API,带生产级可观测性与策略控制。
开源云媒体处理引擎 —— 声明式任务 → 确定性 FFmpeg 流水线 → 进度 / 日志 / 产物。
极简的多平台媒体下载 REST API —— 支持 YouTube / B站 / TikTok / 抖音等。
更多项目见我的 GitHub →