Jais,阿拉伯语AI大模型,正式开源,参数规模达到130亿
重新编写的内容是:出品 | OSC开源社区(ID:oschina2013)
近日,阿联酋的一个研究团队宣布开源了一款名为Jais的阿拉伯语大模型
Jais是一个经过130亿个参数预训练的阿拉伯语和英语双语大型语言模型。它是在包含720亿个阿拉伯语词块和2790亿个英语/代码词块的数据集上进行训练的。该模型是由Cerebras、阿联酋人工智能大学和G42旗下子公司Inception合作研发的
Jais 的命名源自阿联酋最高峰。阿联酋人工智能大学教授Timothy Baldwin指出,由于缺乏足够的阿拉伯语数据来训练Jais模型,因此利用英语数据中的计算机代码有助于提升模型的推理能力
这个模型现在已经开源了,用户可以从HuggingFace获取
需要重写的内容是:https://huggingface.co/inception-mbzuai/jais-13b
C++之父Bjarne Stroustrup的人生建议如下:
Meta开源Code Llama,自称为编程领域中的“最先进的大语言模型”
登顶黑客新闻!国产编程语言MoonBit(月兔)来到了
这里提供最新的开源资讯、软件更新和技术干货等内容
请点击这里 ↓↓↓ 记得关注✔ 标星⭐ 哦
以上是Jais,阿拉伯语AI大模型,正式开源,参数规模达到130亿的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

热门话题

ChatGPT大火带动AI又一波热潮,不过业界普遍认为,当AI步入大模型时代,只有大企业和超级富有的企业才玩得起AI,因为AI大模型的打造非常昂贵。首先是计算昂贵。多伦多大学市场营销教授AviGoldfarb说:“如果你想创办一家企业,自己开发大语言模型,自己计算,成本太高了。OpenAI是很贵的,要数以十亿计的美元。”租赁计算当然会便宜不少,但企业仍然要向AWS等企业支付昂贵费用。其次是数据昂贵。训练模型需要海量数据,有时数据是现成的,有时不是。CommonCrawl和LAION等数据可以免费

近年来,随着新技术模式的出现,各行业应用场景价值打磨与海量数据积累下的产品效果提升,人工智能应用已从消费、互联网等领域,向制造、能源、电力等传统行业辐射。各行业企业在设计、采购、生产、管理、销售等经济生产活动主要环节的人工智能技术和应用成熟度在不断提升,加速人工智能在各环节的落地覆盖,逐渐将其与主营业务相结合,以实现产业地位提高或经营效益优化,进一步扩大自身优势。人工智能技术创新应用的大规模落地,推动了大数据智能市场的蓬勃发展,同样也为底层的数据治理服务注入了市场活力。伴随着大数据、云计算以及算

AI大模型是指使用大规模数据和强大的计算能力训练出来的人工智能模型。这些模型通常具有高度的准确性和泛化能力,可以应用于各种领域,如自然语言处理、图像识别、语音识别等。AI大模型的训练需要大量的数据和计算资源,通常需要使用分布式计算框架来加速训练过程。这些模型的训练过程非常复杂,需要对数据的分布、特征的选择、模型的结构等方面进行深入的研究和优化。AI大模型的应用范围非常广泛,可以用于各种场景,如智能客服、智能家居、自动驾驶等。在这些应用中,AI大模型可以帮助人们更快速、更准确地完成各种任务,提高工

生成式AI(AIGC)开启了人工智能通用化的新纪元,围绕大模型的百舸争流蔚为壮观,算力基础设施是首要的竞逐焦点,而存力觉醒也日益成为业界共识。在新的时代,大模型从单模态走向多模态,参数和训练数据集的规模呈几何级数增长,海量的非结构化数据需要高性能混合负载能力的支撑;与此同时,数据密集型范式大行其道,超算、高性能计算(HPC)等应用场景迈向纵深,既有的数据存储基座已难以满足不断升级的需求。如果说算力、算法、数据是驱动人工智能发展的“三驾马车”,那么在外部环境发生巨大变化的背景下,三者亟需重新达成动

vivo于11月1日在2023年的开发者大会上发布了自主研发的通用人工智能大模型矩阵——蓝心大模型vivo宣布,蓝心大模型将推出5款不同参数量级的模型,分别包含十亿、百亿、千亿三个级别的参数,覆盖核心场景,模型能力在行业中处于领先地位。vivo认为,一个好的自研大模型需要满足以下5点要求:规模大,功能全面,算法强劲,安全可靠,自主进化,并且要广泛开源重写后的内容如下:其中,首先是蓝心大模型7B,这是一个70亿级别的模型,旨在为手机端和云端提供双重服务。vivo表示,该模型在语言理解、文本创作等场

最近,一支计算机科学家团队研发了一种更灵活、更具弹性的机器学习模型,它们具有周期性遗忘已知信息的能力,这是现有大型语言模型所不具备的特点。实测表明,在很多情况下,“忘却法”的训练效率很高,忘却型模型表现也会更好。韩国基础科学研究院(InstituteforBasicScience)的AI工程师JeaKwon说,新研究意味着AI领域取得明显进步。“忘却法”训练效率很高目前主流的AI语言引擎大多采用人工神经网络技术。这种网络结构中的每个“神经元”实际上是一个数学函数,它们之间相互连接,接收和传递信息

1978年,来自加州大学的StuartMarson等人,成立了世界上第一家CADD商业公司,开创性地研发出了一套化学反应及数据库的检索系统。自此开始,计算机辅助药物设计(CADD)进入快速发展的时代,成为药企进行药物研发的重要手段之一,为这一领域带来了革命性的升级。1981年10月5日,《财富》杂志发表了题为《下一次工业革命:默克公司通过计算机设计药物》的封面文章,正式宣告了CADD技术的问世。1996年,第一款基于SBDD(基于结构的药物设计)研发的药物碳酸酐酶抑制剂成功上市,CADD在药物研

最近一段时间,人工智能再次成为人类创新的焦点,围绕AI的军备竞争比以往任何时候都更加激烈。不仅科技巨头纷纷扎堆加入大模型之战,生怕错过了新风口,就连包括北京、上海、深圳等地也纷纷出台政策举措,致力于开展大模型创新算法及关键技术研究,打造人工智能创新高地。AI大模型蓬勃发展,各大科技巨头纷纷加入近日,在2023中关村论坛上发布的《中国人工智能大模型地图研究报告》显示,中国人工智能大模型正呈现蓬勃发展态势,出现了多个在行业有影响力的大模型。百度创始人、董事长兼CEO李彦宏更是直言,我们正处在全新起点
