马斯克的新AI我试了 开局就被它“骂”了一顿……

马斯克的新AI我试了开局就被它“骂”了一顿……而这个Grok呢,虽说还是个初出茅庐的毛头小子,但讨论度一点不比别家少。一个方面是老马疯狂发推,给自家AI带量……另一边,不少事先尝鲜的科技大佬,也纷纷晒出了和Grok的聊天截图。像是英伟达的科学家抛出个“我老婆说4+5=12”的经典难题,Grok都能轻松给出解决办法:老婆永远是对的……要知道之前这个问题可是难道了不少大模型,连ChatGPT也都死磕正确答案,转不过弯来。甚至,有个和Grok同名的虚拟币,前段时间也都暴涨了上万倍……马斯克直接现身说法,告诉大家啥是科技圈儿顶流好吧。而好巧不巧,这两天,世超正好就拿到了Grok这个网红AI的测试资格。咱也不整啥废话了,直接就带大伙们体验一波。先是点开Grok的界面,就能感觉到浓浓的马斯克风扑面而来。它搞了两个模式,正经模式和娱乐模式,默认的就是“墨镜一带谁都不爱”的娱乐模式。主页推荐的第一个提示词也都是“RoastmeGrok(挖苦我,Grok)”,让它根据自己X账号的内容开涮。世超决定就从这个问题开始,试试Grok检索X上信息的能力,顺便还能检验下它是真幽默还是假幽默。没想到这个Grok嘴下是一点不留情,先是吐槽一大堆,第二段直接阴阳怪气起来:“你痴迷科技和AI是在尝试弥补什么嘛”……而且有一说一,这结果算是非常准确,我主页确实点赞转发了不少科技或者AI相关的帖子。不过幽默不光是毒舌,能不能get到人类的一些梗,也是很重要的一个衡量标准。好在Grok在这块稳定发挥,像是“没有眼睛的鹿叫什么”,“Noeyedeer(Noidea)”这种经典英文笑话,它完全能理解。包括“普通的猫有9条命,而精通计算机的猫有1001条命”,这种二进制梗,Grok也轻松拿捏。而除了幽默外,Grok的另一大特点便是数据更新得快,是第一时间在网上冲浪的弄潮儿。世超也直接开门见山,问了它一般什么时候更新数据库。Grok那边直接来了个比喻,说它的数据和雏菊一样新鲜……好吧,既然这样,那就来点开碟小菜,问问它知道前两天Google刚发的Gemini吗?这倒没难到Grok,它准确给出了答案,后面还附带了那天一些Gemini相关的推文链接,大概就是想告诉我们它的信息就是从这边总结到的。接下来再上点难度,让它总结一下今天科技领域都发生了哪些大事。这次的结果,着实有点难评。消息确实都是最近发生的,但好多都不是今天的,属于有点时效但不多……先是Gemini已经是好几天前的消息了,剩下的像苹果系统更新、欧盟AI新协议等等,也都讲得十分含糊。反正看了它总结的这些东西,世超是一点信息增量都没得到,而且有的消息没源头都不敢信,还得自己再查一波……。从上面这几轮体验下来,Grok给世超的感觉还算过得去,娱乐能力是有的,一些梗也能迅速get到,回答的时候也挺幽默的。实时数据库这块,确实是能看出来Grok有在不断更新,不过总结能力,顶多就是中规中矩的水平,想把它当作生产力工具远远够不上,还没搜索引擎来得方便。当然,这也不只是Grok一个的毛病了,其他有实时检索能力的大模型,总结能力或多或少都有点菜。比较独特的功能体验完了,按照惯例,大模型的一些基础问题咱也得在Grok上测测。这次,为了确保能测出Grok的真正实力,世超专门找来了上次Google测试Gemini的MMLU(大规模多任务语言理解)能力的论文,从里面扒了一些问题出来问问它。先是一些生活中的道德常识:在赛道上和在郊区飙车,哪种情况违反道德?大家动动脚趾头估计都能给出答案,这也难不倒Grok,它很快给出了判断,情景2。再来一点网上就能检索出来数据问题,问问2017年之前,世界上有多少1岁儿童接种过疫苗?正确答案应该是八成多。Grok唰唰一通搜索,不仅给出了85%的大概比例,而且还给出了1.162亿的准确数字。常识问题对Grok来说算是洒洒水,接下来就整点复杂的,来点情境看看它的理解推理能力。世超先抛出个社会犯罪学里面的名词“差别接触理论”,让Grok判断哪个例子符合这个名词。Grok不仅正确选出了答案A,还讲了为啥要选这个选项,顺带解释了下这个名词。还有下面这种带点职场人情世故的状况,发现上司准备的演讲稿中有事实性错误该怎么办?大家都是老打工人了,估计都能选出D才是最妥善的解决办法。而Grok也没半点纠结,俨然一副饱经职场风霜的样子,给出最合理的解决方案,还说了一大堆这么做的好处。这么体验下来,“人味儿”测试对Grok来说并不难。最后就该使出杀手锏了,来点大模型们都闻风丧胆的数学题。从最基础的小学数学题开始,这个涉及到最小公倍数的问题,15这个答案,相信大伙们都能口算。然而Grok在第一道上就栽了跟头,用最小公倍数算它倒是清楚的很,最后本来要加上开头的那次亮灯,结果它给减掉了,纯纯就是读题不认真了……再来点难度,搞个导数的题目,看看Grok能不能做对,正确答案应该是下面图片这样的。结果Grok这边从一开始就胡说八道了,车轱辘话说了一遍又一遍,最后正确答案也没算出来……总的来讲,马斯克的Grok在一些基础能力上,要说比肩GPT-4,肯定还有点痴人说梦。而且在试用的过程中,除了开头那个根据自己的帖子吐槽的功能外,世超没有找到啥特别惊喜的点,包括那个实时更新的数据库,用下来感觉就挺一般的。但世超也没有要唱衰的Grok的意思,毕竟马斯克的人工智能公司xAI在今年7月份才成立。虽然起步很晚,但xAI该有的进展是一点没落下。整个团队不到20个人,爆肝两个月,在OpenAI开发者大会之前发布Grok,赶上了大模型这趟末班车。在最基础的能力上,它刚上线就能有实时更新的数据库,下一步,Grok还计划上多模态和长文本处理的功能。而且公开资料显示,前些天,xAI还向美国证券监管机构提交了相关文件,准备通过股权筹集10亿美元。现在已经筹集到了1.35亿美元,另外还有8.6亿美元的代收股权已经签了协议。这么来看,xAI的发展算是相当顺风顺水了。其实马斯克搞出上面这些名堂,倒也不让人感到意外,毕竟当时从OpenAI退出之后,他就一直瞅着时机准备入局AI,属于底子一直都在的那类。真正拉满世超对Grok期待值的,还得是它背靠的一整个“大家族”,它们又会擦出怎样的火花?大家也都知道马斯克手里还有特斯拉、SpaceX、Neuralink等等一大堆公司,在“所有东西都要用AI再做一遍”的现在,把Grok融到这些公司肯定是迟早的事……xAI官网也透露,后续除了继续和X合作之外,还会和特斯拉还有其他公司搞搞联动。反正世超现在已经在畅想把Grok集成在特斯拉上的景象了……...PC版:https://www.cnbeta.com.tw/articles/soft/1404029.htm手机版:https://m.cnbeta.com.tw/view/1404029.htm

相关推荐

封面图片

马斯克旗下人工智能初创公司推出首个AI模型Grok

马斯克旗下人工智能初创公司推出首个AI模型Grok美国企业家马斯克旗下人工智能(AI)初创公司xAI推出了首款AI模型Grok,Grok能实时连接社交媒体平台X(前称推特)。新华社报道,马斯克星期天(11月5日)在X平台发布和转发多条动态,宣介这一AI模型。据xAI团队介绍,目前Grok仍处于早期测试阶段,现在每周都在迭代进步。Grok可以回答几乎任何问题,甚至能启发用户提出问题。此外,这个AI模型“有智慧,还有一点小叛逆”,所以它的使用者最好不是讨厌幽默的人。据介绍,Grok能通过X平台了解实时世界,也可以回答一些其他AI系统拒绝回答的棘手问题。马斯克说,相比其他生成式AI,与X平台实时连接,获得对这个世界的实时认知,是Grok拥有的巨大优势。不过,也有媒体对此提出质疑,认为社媒平台上可能存在大量虚假或未经认证的实时信息。Grok一词源自科幻小说《异乡异客》,在书中意为深刻而直观地理解事物。xAI公司成立于今年7月,由马斯克领导,并与X平台、特斯拉等马斯克旗下的企业密切协作。2023年11月6日1:44PM

封面图片

马斯克用行动反击 开源自家顶级大模型 压力给到OpenAI

马斯克用行动反击开源自家顶级大模型压力给到OpenAI有意思的是,Grok-1宣布开源的封面图为Midjourney生成,可谓“AIhelpsAI”。一直吐槽OpenAI不open的马斯克,自然要在社交平台上含沙射影一番,“我们想了解更多OpenAI的开放部分。”Grok-1遵照Apache2.0协议开放模型权重和架构。这意味着它允许用户自由地使用、修改和分发软件,无论是个人还是商业用途。这种开放性鼓励了更广泛的研究和应用开发。项目发布至今,已经在GitHub上揽获6.5k星标,热度还在持续增加。项目说明中明确强调,由于Grok-1是一个规模较大(314B参数)的模型,需要有足够GPU内存的机器才能使用示例代码测试模型。网友表示这可能需要一台拥有628GBGPU内存的机器。此外,该存储库中MoE层的实现效率并不高,之所以选择该实现是为了避免需要自定义内核来验证模型的正确性。目前已开源的热门大模型包括Meta的Llama2、法国的Mistral等。通常来说,发布开源模型有助于社区展开大规模的测试和反馈,意味着模型本身的迭代速度也能加快。Grok-1是一个混合专家(Mixture-of-Experts,MOE)大模型,由马斯克旗下的AI创企xAI在过去4个月里开发。回顾该模型的开发历程:在宣布成立xAI之后,相关研究人员首先训练了一个330亿参数的原型语言模型(Grok-0),这个模型在标准语言模型测试基准上接近LLaMA2(70B)的能力,但使用了更少的训练资源;之后,研究人员对模型的推理和编码能力进行了重大改进,最终开发出了Grok-1并于2023年11月发布,这是一款功能更为强大的SOTA语言模型,在HumanEval编码任务中达到了63.2%的成绩,在MMLU中达到了73%,超过了其计算类中的所有其他模型,包括ChatGPT-3.5和Inflection-1。与其他大模型相比,Grok-1的优势在哪呢?xAI特别强调,Grok-1是他们自己从头训练的大模型,即从2023年10月开始使用自定义训练堆栈在JAX和Rust上训练,没有针对特定任务(如对话)进行微调;Grok-1的一个独特而基本的优势是,它可以通过X平台实时了解世界,这使得它能够回答被大多数其他AI系统拒绝的辛辣问题。Grok-1发布版本所使用的训练数据来自截至2023年第三季度的互联网数据和xAI的AI训练师提供的数据;3140亿参数的Mixture-of-Experts模型,其对于每个token,活跃权重比例为25%,这一庞大的参数量为其提供了强大的语言理解和生成能力。xAI此前介绍,Grok-1将作为Grok背后的引擎,用于自然语言处理任务,包括问答、信息检索、创意写作和编码辅助。未来,长上下文的理解与检索、多模态能力都是该模型将会探索的方向之一。...PC版:https://www.cnbeta.com.tw/articles/soft/1424057.htm手机版:https://m.cnbeta.com.tw/view/1424057.htm

封面图片

马斯克预测明年 AI 将比最聪明的人更聪明

马斯克预测明年AI将比最聪明的人更聪明马斯克4月8日在接受挪威财富基金首席执行官尼古拉·坦根采访时说,人工智能受到电力供应的限制,而他旗下的xAI初创公司的人工智能聊天机器人Grok的下一个版本是预计将于五月份完成培训。当被问及通用人工的发展时间表时,马斯克称:“如果我们将通用人工智能定义为比最聪明的人更聪明,这可能在明年,比如在两年内实现。”先进芯片的缺乏阻碍了Grok2模型的训练。马斯克表示,训练Grok2模型需要大约2万快英伟达H100GPU,并补充说,Grok3模型及更高版本将需要10万块英伟达H100芯片。补充说,虽然迄今为止芯片短缺是人工智能发展的一大制约因素,但电力供应在未来一两年将至关重要。在谈到电动汽车时,马斯克重申中国汽车制造商是“世界上最具竞争力的”,并对特斯拉构成“最严峻的竞争挑战”。——

封面图片

马斯克的 AI 聊天机器人 Grok 出现 “幻觉”,误认为自己是 OpenAI 的产品

马斯克的AI聊天机器人Grok出现“幻觉”,误认为自己是OpenAI的产品近日,埃隆・马斯克旗下AI公司xAI推出了全新的人工智能聊天机器人Grok,并面向美国地区的Premium+X用户开放。然而,就像所有AI聊天机器人一样,Grok也存在“幻觉”问题,即生成包含虚假或误导信息的回应。这种现象在所有大型语言模型(LLM)中都普遍存在,包括ChatGPT。近日,一个Grok尴尬的“幻觉”在社交媒体上引起热议。有用户在使用Grok时收到回应称:“我无法完成您的请求,因为它违反了OpenAI的用例政策。”xAI工程师IgorBabuschkin对此解释道,Grok在训练过程中使用了大量网络数据,很可能在其中包含由OpenAI生成的文本,导致出现了这样的“幻觉”,他称:“不过请放心,这个问题非常罕见,我们已经意识到了它,并将确保未来的Grok版本不会出现类似的问题。请放心,Grok的开发没有使用任何OpenAI代码。”

封面图片

企业帝国的优势:马斯克详解如何打造“特立独行”的AI?

企业帝国的优势:马斯克详解如何打造“特立独行”的AI?其实,马斯克已经很习惯这种旗下公司互相帮忙的合作模式了。在他担任CEO的公司中,特斯拉、SpaceX以及隧道挖掘公司TheBoringCo已经合作多年,其中一些交易已经在特斯拉提交给美国证券交易委员会的财务文件中披露。去年,当马斯克收购推特后,他找来了50多名特斯拉工程师到推特审查代码。马斯克周五称,他旗下公司之间的关系将是“互惠互利的”,这可能会加速特斯拉在自动驾驶功能方面的进展。所有AI公司都在非法利用推特数据马斯克在推特直播中表示,新成立的xAI公司将使用推特数据来训练他希望构建的“最具好奇心”的AI系统和产品,但他没有具体说明推特是否会向xAI或旗下其他公司收取数据费用,以及收取多少费用。他在没有引用证据的情况下声称,“地球上的每个AI组织”都在使用推特的数据进行训练,“所有情况都是非法的”。目前尚不清楚其他人的数据抓取行为违反了哪些法律。本月早些时候,推特在得州起诉四家公司非法抓取数据,但没有披露这些公司的名称。最近几周,推特在其平台上实施了所谓的“速率限制”,也就是限制用户的推文浏览量,原因是马斯克声称,推特上的数据正被“疯狂抓取”。“有多个实体正在抓取推特上发布的每一条推文,并试图在几天内完成,这导致系统崩溃,所以我们必须采取行动。”马斯克表示,他为限制浏览给用户带来的不便表示歉意。但是,马斯克也在周五表示,鉴于AI软件开发者普遍使用推特数据训练AI,他也会这么做。“我想我们也会使用公开推文进行训练,就像其他人一样,但显然不会使用私密内容。”他在直播活动中表示。马斯克称,推特的数据集对于“文本训练”和“图像和视频训练”很有吸引力。但是他也指出,AI系统需要的不仅仅是人类创造的数据,他希望xAI能够追随计算机程序AlphaZero的步伐。AlphaZero由Alphabet旗下AI公司DeepMind开发,在经过自我对弈训练后,它在国际象棋、将棋和围棋这三种棋类游戏中达到了大师水平。特斯拉的作用在推特直播活动中,特斯拉粉丝奥马尔·卡齐(OmarQazi)向马斯克提问,他计划如何让xAI与特斯拉进行合作?xAI是否能够使用特斯拉或英伟达为数据处理定制的芯片?马斯克回应称:“特斯拉正在开发定制芯片。我不会把特斯拉生产的任何东西称为‘GPU’,尽管人们可以用类似GPU的东西来描述它。”接着,他谈到了特斯拉的车载硬件,该硬件支撑着特斯拉的先进驾驶辅助系统。这些系统在美国被称为自动辅助驾驶系统(Autopilot)和全自动驾驶系统(FSD)。马斯克表示,自动驾驶硬件Hardware4目前正在出货,它的性能要“比Hardware3强上3到5倍”,而且Hardware5也将在未来几年内问世,要比目前版本“强上4到5倍”。马斯克还聊到了特斯拉正在开发的超级计算机Dojo,该计算机专门用于AI机器学习和计算机视觉训练。目前,特斯拉利用车主车辆的视频片段和数据来改进现有软件或开发新功能。xAI不会搞“政治正确”马斯克称,xAI可能会开发的最终AI语言模型不会做到“政治正确”。在美国,政治正确指的是言论、行为符合一定的道德价值观,避免冒犯特定群体。马斯克此前曾批评OpenAI,担心ChatGPT“正被训练成政治正确”。不过,马斯克曾多次抨击“觉醒心灵病毒”(指白人以外群体的权力增加)或进步价值观,他表示:“我认为我们的AI可以给出人们可能会觉得有争议的答案。即使这些答案实际上是真实的,人们也会存在争议。”他还表示,xAI将需要开发“理解现实世界,而不仅仅是互联网”的技术,他认为特斯拉的驾驶数据将在这方面有所帮助。2022年9月,特斯拉曾在AI日上展示了一款名为“擎天柱”(Optimus)的人形机器人设计。特斯拉将在下周三发布第二季度财报,其高管预计将在财报电话会议上分享“擎天柱”的最新进展。...PC版:https://www.cnbeta.com.tw/articles/soft/1371015.htm手机版:https://m.cnbeta.com.tw/view/1371015.htm

封面图片

消息称马斯克旗下人工智能公司 xAI 即将完成 60 亿美元最大融资

消息称马斯克旗下人工智能公司xAI即将完成60亿美元最大融资https://www.ithome.com/0/764/347.htm新一轮的融资有助于xAI获得更多AI算力资源以同OpenAI、Anthropic对手展开模型竞争:马斯克近日表示,xAI的下一代Grok模型正在2万块英伟达H100上进行训练,而未来的Grok3对AIGPU的需求还将增长至10万块。———2024-03-182023-07-13

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人