我用GPT+Langchain Agent制作了一个智能管家,结合微软的语音服务,实现了语音唤醒,语音对话,语音控制智能家居的功能。本文来详细介绍下实现原理,代码已经放在Github上开源,供学习交流。
GitHub链接:mawwalker/moss, 如果觉得有帮助,欢迎给个star。
我用GPT+Langchain Agent制作了一个智能管家,结合微软的语音服务,实现了语音唤醒,语音对话,语音控制智能家居的功能。本文来详细介绍下实现原理,代码已经放在Github上开源,供学习交流。
GitHub链接:mawwalker/moss, 如果觉得有帮助,欢迎给个star。
最近看到太多"这个男人叫小帅"的配音视频,有点审美疲劳了,球球你们换个有感情的AI配音吧。 用了下微软跟Google的文本转语音服务,对比了下,微软的效果强太多了,AI风格有很多,并且多数感情丰富,还支持多种方言配音。最关键的是,每个月有50万字符的免费使用额度。 这还不赶紧用起来。
前不久Google 开放了他们的大语言模型Gemini,目前Gemini Pro版已经可以通过开放API使用,搭建过程非常方便。 顺带,我把这个API接入到了我的Telegram机器人中,反正免费的,当作一个个人助手使用。 参考我的另一篇博客:基于flask和webhook的telegram 机器人 Github仓库在这:mawwalker/Archbot
最近丢了一个U盘,好在里面没什么重要信息。有时候我会用U盘备份一些文件,包括ssh密钥文件。如果有一天装有自己密钥文件的U盘丢失,被人捡到的话,会非常不安全。因此简单研究了下磁盘的加密操作,在此记录一下。虽然加密、解密增加了使用U盘的复杂性,但是如果真的有一些文件,使用互联网备份怕泄漏的,还是需要一些加密手段来保护的。这里只试了在Linux下的操作,基于cryptsetup命令行工具。
我在知乎上回答问题:“你为什么使用某个特定 Linux 发行版?”时写的答案。 你为什么使用某个特定 Linux 发行版?
Yolov5 不做赘述,目前目标检测里使用非常多的模型,效果和速度兼顾,性能强悍,配合TensorRT推理加速,在工业界可以说是非常流行的组合。
作为一名深度学习炼丹师,配置CUDA环境是一项必不可少的技能,所谓工欲善其事,必先利其器。
在Linux中,终端是非常强大的,很多时候往往离不开在终端中编辑文件,此时,vim就会派上用场。默认的vim操作,对于很多初接触Linux的来说,可以说是专业劝退了,所以这篇主要讲讲vim的一些基础使用,高端配置(如,将vim配置成一个C/C++/Python IDE)后续更新接上。
在深度学习(机器学习)领域,训练模型时,我们不仅要求模型对训练数据集有很好的拟合(较低的训练误差),同时也希望它可以对未知数据集(测试集)有很好的拟合结果(泛化能力),所产生的测试误差被称为泛化误差。其中就会产生欠拟合和过拟合的问题。