1 數(shù)字人開源項目Fay Fay是一個集成了語言模型和數(shù)字字符的開源數(shù)字人類框架。它為不同的應(yīng)用程序提供零售、助手和代理版本,如虛擬購物指南、廣播、助手、服務(wù)員、教師和基于語音或文本的移動助手。開發(fā)人員可以利用該項目簡單地構(gòu)建各種類型的數(shù)字人或數(shù)字助理。該項目各模塊之間耦合度非常低,包括聲音來源、語音識別、情緒分析、NLP處理、情緒語音合成、語音輸出和表情動作輸出等模塊。每個模塊都可以輕松地更換。https://github.com/xszyou/Fay 2 ChatTTS語音克隆 ChatTTS是一款神奇工具,能讓你的文字像人一樣說話,而且聽起來自然真實。這個工具適合用在需要語音合成的場景,比如智能助手、客服機器人,甚至是讓你的文章或故事開口說話。ChatTTS是專門為對話場景設(shè)計的文本轉(zhuǎn)語音模型,例如LLM助手對話任務(wù)。它支持英文和中文兩種語言。最大的模型使用了10萬小時以上的中英文數(shù)據(jù)進行訓練。對話式 TTS: ChatTTS針對對話式任務(wù)進行了優(yōu)化,實現(xiàn)了自然流暢的語音合成,同時支持多說話人。 細粒度控制: 該模型能夠預測和控制細粒度的韻律特征,包括笑聲、停頓和插入詞等。 更好的韻律: ChatTTS在韻律方面超越了大部分開源TTS模型。同時提供預訓練模型,支持進一步的研究。
https://github.com/2noise/ChatTTS 3 開源對話語言模型MOSS MOSS是一個支持中英雙語和多種插件的開源對話語言模型,moss-moon系列模型具有160億參數(shù),在FP16精度下可在單張A100/A800或兩張3090顯卡運行,在INT4/8精度下可在單張3090顯卡運行。MOSS基座語言模型在約七千億中英文以及代碼單詞上預訓練得到,后續(xù)經(jīng)過對話指令微調(diào)、插件增強學習和人類偏好訓練具備多輪對話能力及使用多種插件的能力。https://github.com/OpenMOSS/MOSS 4 公眾號文章下載器 分享一款公眾號文章下載軟件,叫wechatDownload,是GitHub上的開源項目。真的非常好用,用它我們可以很好地批量把喜歡的文章下到本地保存。https://github.com/xiaoguyu/wechatDownload/ 5 開源Cobat下載器 Cobat是一個媒體下載器,不會惹你生氣。它快速、友好,沒有現(xiàn)代網(wǎng)絡(luò)所充斥的任何胡說八道,沒有廣告、跟蹤器或侵入性分析。它支持多種流媒體服務(wù),包括 B站、you管、tiktok 等。https://github.com/imputnet/cobalt
6 音樂下載器 一個通過Python編寫的QQ、網(wǎng)易云音樂無損音樂爬取工具它目前支持的操作有 解析QQ音樂/網(wǎng)易云會員無損單曲 網(wǎng)易云歌單/QQ音樂歌單批量下載 批量轉(zhuǎn)換文件夾內(nèi)的音頻為mp3 QQ音樂/網(wǎng)易云自定義音質(zhì)解析 網(wǎng)易云二維碼登錄/驗證碼登錄雙協(xié)議支持 網(wǎng)易云刷單曲播放量(一分鐘刷300+) 網(wǎng)易云雙語歌詞下載
https://github.com/cwuom/MusicHelper/ 7 BiliBili公開課目錄 這是一份公開課的目錄,這里的視頻大多來自 YouTube 等國內(nèi)無法訪問的網(wǎng)站,為了方便國內(nèi)的朋友觀看,我將這些視頻搬運到了 Bilibili。https://github.com/elder-frog/OpenCourseCatalog 8 REKCARC-TSC-UHT 這個項目是按清華大學的資料按照年級來分類,包括了電子版課件和參考教材、日常作業(yè)答案和大作業(yè)資料、歷年試卷和復習資料。從本科到研究生都有,如下圖所示: https://github.com/PKUanonym/REKCARC-TSC-UHT 9 浙江大學課程攻略 浙江大學課程攻略共享計劃,包含了各種課程和學習資料 。等等,目前項目已覆蓋大多數(shù)計科的專業(yè)課程。https://github.com/QSCTech/zju-icicles ~
|