Linuxword Global
当前位置: Linux技术 > MobiLlama,一个0.5B大小能在手机上运行的小型语言模型

GHV9wYJa8AAs4MS

该模型基于LLaMA-7B架构设计,旨在能够在边缘设备上高效运行,无需将数据发送到远程服务器或云端处理。如智能手机、平板电脑、智能手表等。
MobiLlama模型虽然体积小、对资源的需求低,但仍能提供高精度的语言理解和生成能力。
项目还提供了在安卓上运行MobiLlama模型的方法和安装包下载链接。https://mbzuaiac-my.sharepoint.com/:f:/g/personal/omkar_thawakar_mbzuai_ac_ae/EhRfGdmgFVVNvIRfy1EgLwEBjbk_eg3UmNg_zjz7PMTsmg?e=NBuJo8
主要能力:
1、高精度的语言理解与生成:即便参数规模相对较小(0.5亿参数),MobiLlama也能高效处理自然语言理解和生成任务,如文本摘要、问答系统、自然语言推理等。
2、轻量级设计:通过优化模型架构和采用参数共享技术,MobiLlama实现了模型大小和计算资源需求的显著减少,使其适合在计算能力有限的设备上运行。
3、资源效率高:MobiLlama在设计时考虑了能效和内存使用效率,使其在执行任务时消耗更少的电力和存储空间,适合长时间运行在移动设备上。
4、适应性强:由于其轻量级和高效的特性,MobiLlama可以轻松集成到各种应用中,从智能助手到语言翻译工具,都能从其快速、精确的处理能力中受益。
-模型类型:基于LLaMA-7B架构设计的语言模型。
-语言/领域:主要针对英语NLP任务。
-全透明:MobiLlama项目开源,提供了模型的训练数据、代码和训练过程的详细信息,使其他研究者和开发者可以完全了解模型的工作原理,有助于促进技术的进步和应用的开发。
MobiLlama项目提供了不同配置的模型版本,包括0.5B、0.8B、1B及其聊天版本的模型。
0.5B:这个版本的模型有0.5亿参数,是设计中最轻量级的一个,旨在提供较高的效率和速度,同时保持良好的性能,特别适合在资源受限的设备上使用。
0.8B:0.8亿参数的模型在0.5B的基础上增加了参数,以改进模型的性能和理解能力,适合于需要更复杂处理能力的场景。
1B:1亿参数的模型进一步增强了模型的能力,能够处理更复杂的语言理解和生成任务,适用于对性能要求更高的应用。
数据集:
项目使用了预处理过的Amber数据集,总计约1.2万亿token,数据来源包括Arxiv、Book、C4、Refined-Web、StarCoder、StackExchange和Wikipedia等,总大小约为8TB。
评估结果:
基准测试性能
MobiLlama模型在包括HellaSwag、TruthfulQA、MMLU、ARC_C、CrowsPairs、PIQA、RACE、SIQA、WinoGrande等测试中的性能表现,与其他模型进行了比较。在这些基准测试中,MobiLlama表现出色,尤其是在0.5B和0.8B配置下,展现了其高效处理复杂语言任务的能力。具体的评估结果如下:
MobiLlama (0.5B):在多项任务中取得了优异的成绩,平均得分达到46.00,突出显示了模型的高效率和准确性。
MobiLlama (0.8B):进一步提升了性能,平均得分达到46.67,表明了通过增加模型规模可以进一步提升性能。
比较分析
与其他模型相比,如GPT-NEO、TinyStarCoder、Cerebras-GPT等,MobiLlama在相同或更小的参数规模下,能够实现更高的准确度和效率。这些结果凸显了MobiLlama在设计上的优势,即通过参数共享和模型优化,实现了在资源有限的设备上运行高性能模型的目标。
具体性能对比
GPT-NEO (0.15B):平均得分为40.93。
TinyStarCoder (0.17B):平均得分为37.86。
Cerebras-GPT (0.26B):平均得分为40.69。
MobiLlama的性能优于这些模型,展现了其作为小型语言模型的竞争力和潜力。
模型下载:https://huggingface.co/MBZUAI
GitHub:https://github.com/mbzuai-oryx/MobiLlama
论文:https://arxiv.org/abs/2402.16840
在线体验:https://845b645234785da51b.gradio.live

「梦想一旦被付诸行动,就会变得神圣,如果觉得我的文章对您有用,请帮助本站成长」

赞(0) 打赏
一分也是爱

支付宝扫一扫打赏

微信扫一扫打赏

上一篇:

下一篇:

相关推荐

博客简介

本站CDN采用VmShell免费提供离中国大陆最近的香港CMI高速网络做支撑,ToToTel打造全球最快速的边沿网络支撑服务,具体详情请见 :https://vmshell.com/ 以及 https://tototel.com/,网站所有的文件和内容禁止大陆网站搬迁复制,谢谢,VPS营销投稿邮箱: admin@linuxxword.com,我们免费帮大家发布,不收取任何费用,请提供完整测试文稿!

精彩评论

友情链接

他们同样是一群网虫,却不是每天泡在网上游走在淘宝和网游之间、刷着本来就快要透支的信用卡。他们或许没有踏出国门一步,但同学却不局限在一国一校,而是遍及全球!申请交换友链

站点统计

  • 文章总数: 2334 篇
  • 草稿数目: 12 篇
  • 分类数目: 6 个
  • 独立页面: 0 个
  • 评论总数: 2 条
  • 链接总数: 0 个
  • 标签总数: 5988 个
  • 注册用户: 139 人
  • 访问总量: 8,657,843 次
  • 最近更新: 2024年4月27日