生物醫學NLP領域的特定預訓練模式:PubMedBERT
今年大语言模型的迅速发展导致像BERT这样的模型现在被称为“小”模型。在Kaggle的LLM科学考试比赛中,使用deberta的选手获得了第四名,这是一个非常出色的成绩。因此,在特定领域或需求中,并不一定需要大型语言模型作为最佳解决方案,小型模型也有其用武之地。因此,今天我们要介绍的是PubMedBERT,它是微软研究院于2022年在ACM上发布的一篇论文,该模型通过使用特定领域的语料库进行BERT的从头预训练
以下是论文的主要要点:
对于具有大量未标记文本的特定领域,例如生物医学领域,从头开始预训练语言模型比持续预训练通用领域语言模型效果显著。为此,我们提出了生物医学语言理解与推理基准(BLURB),用于特定领域的预训练
PubMedBERT
1、特定领域Pretraining
研究表明,从头开始的特定领域预训练大大优于通用语言模型的持续预训练,从而表明支持混合领域预训练的主流假设并不总是适用。
2、模型
利用BERT模型,对于掩码语言模型(MLM),全词屏蔽(WWM)的要求是必须屏蔽整个词
3、BLURB数据集
据作者介绍,BLUE[45]是在生物医学领域创建NLP基准的第一次尝试。但BLUE的覆盖范围有限。针对基于pubmed的生物医学应用,作者提出了生物医学语言理解与推理基准(BLURB)。
PubMedBERT使用更大的特定领域语料库(21GB)。
结果展示
在大多数生物医学自然语言处理(NLP)任务中,PubMedBERT一直表现优于其他所有BERT模型,并且通常具有明显的优势
以上是生物醫學NLP領域的特定預訓練模式:PubMedBERT的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

譯者|布加迪審校|重樓本文介紹如何使用GroqLPU推理引擎在JanAI和VSCode中產生超快速反應。每個人都致力於建立更好的大語言模型(LLM),例如Groq專注於AI的基礎設施方面。這些大模型的快速響應是確保這些大模型更快捷響應的關鍵。本教學將介紹GroqLPU解析引擎以及如何在筆記型電腦上使用API和JanAI本地存取它。本文也將把它整合到VSCode中,以幫助我們產生程式碼、重構程式碼、輸入文件並產生測試單元。本文將免費創建我們自己的人工智慧程式設計助理。 GroqLPU推理引擎簡介Groq

大語言模型潛力被激發-無需訓練大語言模型就能實現高精度時序預測,超越一切傳統時序模型。蒙納士大學、螞蟻和IBM研究院共同開發了一個通用框架,成功推動了大語言模型跨模態處理序列資料的能力。該框架已成為一項重要的技術創新。時序預測有益於城市、能源、交通、遙感等典型複雜系統的決策。自此,大模型可望徹底改變時序/時空資料探勘方式。通用大語言模型重編程框架研究團隊提出了一個通用框架,將大語言模型輕鬆用於一般時間序列預測,而無需做任何訓練。主要提出兩大關鍵技術:時序輸入重編程;提示做前綴。 Time-

想了解更多AIGC的內容,請造訪:51CTOAI.x社群https://www.51cto.com/aigc/譯者|晶顏審校|重樓不同於網路上隨處可見的傳統問題庫,這些問題需要跳脫常規思維。大語言模型(LLM)在數據科學、生成式人工智慧(GenAI)和人工智慧領域越來越重要。這些複雜的演算法提升了人類的技能,並在許多產業中推動了效率和創新性的提升,成為企業保持競爭力的關鍵。 LLM的應用範圍非常廣泛,它可以用於自然語言處理、文字生成、語音辨識和推薦系統等領域。透過學習大量的數據,LLM能夠產生文本

本文將第二屆OpenHarmony技術大會上展示的《在OpenHarmony本地部署大語言模型》成果開源,開源位址:https://gitee.com/openharmony-sig/tpc_c_cplusplus/blob/master/thirdparty/InferLLM/docs/ hap_integrate.md。實作思路與步驟移植輕量級LLM模型推理架構InferLLM到OpenHarmony標準系統,編譯出能在OpenHarmony運作的二進位產物。 InferLLM是個簡單又有效率的L

今天下午,鸿蒙智行正式迎来了新品牌与新车。8月6日,华为举行鸿蒙智行享界S9及华为全场景新品发布会,带来了全景智慧旗舰轿车享界S9、问界新M7Pro和华为novaFlip、MatePadPro12.2英寸、全新MatePadAir、华为毕昇激光打印机X1系列、FreeBuds6i、WATCHFIT3和智慧屏S5Pro等多款全场景智慧新品,从智慧出行、智慧办公到智能穿戴,华为全场景智慧生态持续构建,为消费者带来万物互联的智慧体验。鸿蒙智行:深度赋能,推动智能汽车产业升级华为联合中国汽车产业伙伴,为

大語言模型(LargeLanguageModels,LLMs)在過去兩年內迅速發展,湧現出一些現象級的模型和產品,如GPT-4、Gemini、Claude等,但大多數是閉源的。研究界目前能接觸到的大部分開源LLMs與閉源LLMs存在較大差距,因此提升開源LLMs及其他小模型的能力以減小其與閉源大模型的差距成為了該領域的研究熱點。 LLM的強大能力,特別是閉源LLM,使得科研人員和工業界的從業者在訓練自己的模型時都會利用到這些大模型的輸出和知識。這個過程本質上是知識蒸餾(Knowledge,Dist

目前人工智慧技術面臨的最大風險是大語言模型(LLM)和生成式人工智慧技術的發展和應用速度已經遠遠超過了安全和治理的速度。 OpenAI、Anthropic、Google和微軟等公司的生成式人工智慧和大語言模式產品的使用正呈指數級增長。同時,開源大語言模型方案也在高速成長,HuggingFace等開源人工智慧社群提供了大量開源模型、資料集和AI應用。為了推動人工智慧的發展步伐,OWASP、OpenSSF、CISA等產業組織正在積極開發和提供人工智慧安全與治理關鍵資產,例如OWASPAIExchange、

大語言模型(LLMs)在語言理解和各種推理任務中展現出令人印象深刻的表現。然而,它們在人類認知的關鍵一面——空間推理上,仍然未被充分研究。人類具有透過一種被稱為心靈之眼的過程創造看不見的物體和行為的心智圖像的能力,從而使得對未見世界的想像成為可能。受到這種認知能力的啟發,研究人員提出了「思維視覺化」(VisualizationofThought,VoT)。 VoT旨在透過視覺化其推理跡象來引導LLMs的空間推理,從而引導後續的推理步驟。研究人員將VoT應用於多跳空間推理任務,包括自然語言導航、視覺
