郝彦飞 F5-TTS:克隆的声音 源码地址: https://github.com/SWivid/F5-TTS 视频介绍: https://www.youtube.com/watch?v=ioaqKPfJAm0 文章介绍: https://ai.linbintalk.com/article/f5ttsclone... AI声音 MIT开源 底层工具
郝彦飞 easegen: 开源AI+数字人课程制作 源码地址: 前端: https://github.com/taoofagi/easegen-front 后端: https://github.com/taoofagi/easegen-admin 官网介绍视频: https://space.bilibili.com/422796566 主要功能 1、智能课件 2、智能出题 3、数字人课程制作... Ai数字人 MIT开源
郝彦飞 Eleven Labs:AI语音云服务 主要功能 文章介绍: https://mp.weixin.qq.com/s/qhR6NMnPhhbQ3qhR27ZFaw 官网地址: https://elevenlabs.io/app/speech-synthesis/text-to-speech... AI语音 底层应用
郝彦飞 Swarm:openai官方发布多智能体agent框架,通过两个原始抽象(Agent和handoof)来实现对话在agent之间的切换,非常适合在复杂、高可控的场景 源码地址: https://github.com/openai/swarm 视频介绍: https://www.youtube.com/watch?v=RBAptPtFDao... AI Agent MIT开源 底层工具
郝彦飞 memfree:可商业化、定制的开源AI搜索,从知识库和网页中搜索准确答案,输入输出支持多模态内容,输出包含脑图,还支持生成UI代码和预览,定制AI搜索时代来临,替代360ai搜索等 源码地址: https://github.com/memfreeme/memfree 官方网站&Demo: https://www.memfree.me/zh 视频介绍: https://www.youtube.com/watch?v=HqL_PGEkvpI... AI-搜索 MIT开源 底层工具
郝彦飞 description-generator:基于Llama 3.2 Vision的电商项目,根据商品图片生成多语言产品描述,为电商行业的产品描述提供了一种AI自动化解决方案 视频介绍: https://www.youtube.com/watch?v=XiFuREslh84 源码地址: https://github.com/Nutlope/description-generator 官网Demo: https://product-descriptions.vercel.app/... 底层工具 开源 电商
郝彦飞 Bolt.new:一个由人工智能驱动的网页开发代理,它允许用户直接在浏览器中通过提示来运行、编辑和部署全栈应用程序,无需本地环境设置 Bolt.new is an AI-powered web development agent that allows you to prompt, run, edit, and deploy full-stack applications directly from your browser—no local setup required. If you're here to build you... AI-Code MIT开源
郝彦飞 LiveKit Agent+ OpenAI Realtime:实时语音GPT-4O的开源实现,本地化运行OpenAi的Realtime API,可实现实时AI电话、浏览器或app的实时AI语音交互 官网地址: https://docs.livekit.io/agents/ 源码地址: https://github.com/livekit/agents 视频介绍: https://www.youtube.com/watch?v=L42ZLe59v8Y... 底层工具 开源Apache-2.0 license
郝彦飞 WiLoR: 实时的高精度手部3D重建与追踪 代码: https://github.com/rolpotamias/WiLoR 项目主页: https://rolpotamias.github.io/WiLoR/... 底层技术 开源
郝彦飞 NocoDB:一个开源的 Airtable 替代品。 NocoDB 通过连接到任何关系数据库并将它们转换为智能电子表格界面来工作!这允许你与团队协作构建无代码应用程序。NocoDB 目前适用于 MySQL、PostgreSQL、Microsoft SQL Server、SQLite、Amazon Aurora 和 MariaDB 数据库。 此外,NocoDB 的应用程序商店还允许你结合 Slack、Microsoft Teams、Discord、Tw... AGPL-3.0开源 底层工具 数据处理
郝彦飞 VideoLingo:Netflix级字幕切割、翻译、对齐、甚至加上配音,一键全自动视频搬运AI字幕组 官网: https://videolingo.io/ 源码地址: https://github.com/Huanshere/VideoLingo... 底层工具 开源Apache-2.0 license 视频处理
郝彦飞 GenAI Agents:涵盖16种场景的agents,包含AI数据分析、AI生成动画gif、AI生成音乐、AI论文评分 This repository provides tutorials and implementations for various Generative AI Agent techniques, from basic to advanced. It serves as a comprehensive guide for building intelligent, interactive AI s... AI Agent 应用场景 开源