在智能家居领域,语音控制和自然语言交互正变得越来越重要。本文将详细介绍如何基于LangGraph框架,将Home Assistant的MCP(Model Context Protocol)服务集成进智能语音管家Moss,实现真正的自然语言家居控制。文章将以实用代码为主,帮助你快速上手。
GitHub链接:mawwalker/Moss,欢迎star和交流。
在智能家居领域,语音控制和自然语言交互正变得越来越重要。本文将详细介绍如何基于LangGraph框架,将Home Assistant的MCP(Model Context Protocol)服务集成进智能语音管家Moss,实现真正的自然语言家居控制。文章将以实用代码为主,帮助你快速上手。
GitHub链接:mawwalker/Moss,欢迎star和交流。
随着语音交互在智能设备、办公自动化等场景的普及,实时、高效、易部署的语音识别服务需求日益增长。本文将介绍如何基于 sherpa-onnx 和 SenseVoice,构建一个高性能的 C++ WebSocket 流式语音识别服务器,支持多语言、VAD、容器化部署,并兼容多种客户端。
GitHub 项目地址:mawwalker/stt-server,欢迎 star 和交流。
我用GPT+Langchain Agent制作了一个智能管家,结合微软的语音服务,实现了语音唤醒,语音对话,语音控制智能家居的功能。本文来详细介绍下实现原理,代码已经放在Github上开源,供学习交流。
GitHub链接:mawwalker/moss, 如果觉得有帮助,欢迎给个star。
最近看到太多"这个男人叫小帅"的配音视频,有点审美疲劳了,球球你们换个有感情的AI配音吧。 用了下微软跟Google的文本转语音服务,对比了下,微软的效果强太多了,AI风格有很多,并且多数感情丰富,还支持多种方言配音。最关键的是,每个月有50万字符的免费使用额度。 这还不赶紧用起来。
前不久Google 开放了他们的大语言模型Gemini,目前Gemini Pro版已经可以通过开放API使用,搭建过程非常方便。 顺带,我把这个API接入到了我的Telegram机器人中,反正免费的,当作一个个人助手使用。 参考我的另一篇博客:基于flask和webhook的telegram 机器人 Github仓库在这:mawwalker/Archbot
最近丢了一个U盘,好在里面没什么重要信息。有时候我会用U盘备份一些文件,包括ssh密钥文件。如果有一天装有自己密钥文件的U盘丢失,被人捡到的话,会非常不安全。因此简单研究了下磁盘的加密操作,在此记录一下。虽然加密、解密增加了使用U盘的复杂性,但是如果真的有一些文件,使用互联网备份怕泄漏的,还是需要一些加密手段来保护的。这里只试了在Linux下的操作,基于cryptsetup命令行工具。
我在知乎上回答问题:“你为什么使用某个特定 Linux 发行版?”时写的答案。 你为什么使用某个特定 Linux 发行版?
Yolov5 不做赘述,目前目标检测里使用非常多的模型,效果和速度兼顾,性能强悍,配合TensorRT推理加速,在工业界可以说是非常流行的组合。
作为一名深度学习炼丹师,配置CUDA环境是一项必不可少的技能,所谓工欲善其事,必先利其器。