Meta開源第一個適用於文字、聲音和影像的高效能自我監督演算法Data2vec
不同於過去僅能處理單一模態的自我監督演算法,Data2vec能夠處理文字、聲音和影像,效能甚至超越當前該模態中最先進的演算法
2022-01-22
Google與加州大學共同開發的PEPPER-Margin-DeepVariant,這是一種以遞迴神經網路為基礎的基因推理模組,為當前最快的商業基因定序技術
2022-01-18
| google | 神經網路 | 音訊 | codec | 音訊解編碼器 | AI | SoundStream
Google應用神經網路開發音訊編碼器,不只壓縮音訊還能抑制噪音
SoundStream是第一個神經音訊解編碼器,模型能夠同時壓縮音訊並降低噪音,可在低位元率運作良好
2021-08-13
Azure語音服務新增發音評估功能,其神經網路模型採用特殊分層架構,並以10萬小時的語音訓練,能夠給出專業的發音評估
2021-07-06
讓機器人學習抓取可變形的物體,比抓取剛體難上不少,Google最新的研究可讓機器人按圖像配置,將可變形物體擺設成圖像中的樣子
2021-05-18
臉書新的深度學習方法Expire-Span,會給訊息一個保存期限,過了期限該訊息便會被刪除,藉此只留下重要的資訊
2021-05-18
輕量級語音過濾模型VoiceFilter-Lite,能夠在裝置上高效能運作,不需要網路連線,就能良好辨識目標使用者的聲音,以改善語音辨識的效果
2020-11-13
推特照片剪裁演算法被指存在種族偏差,推特承諾進一步研究並開源成果
當同一張拼貼照同時存在黑人與白人臉孔時,在部分情況下,推特照片剪裁演算法會傾向顯示白人臉孔,而這樣的現象引起推特用戶的熱烈討論
2020-09-23