贾扬清盯上了提示词和AI搜索

创业网 创业资讯 2024-01-24 16:56:15
    贾扬清盯上了提示词和AI搜索
    宣布创业近10个月后,原Facebook人工智能科学家,原阿里技术副总裁,知名开源深度学习框架Caffe的创立者,TensorFlow、Pytorch等框架的核心成员和共同领导者,曾被誉为AI框架领域最厉害的华人科学家--贾扬清,近期携两款颇令人惊艳的新产品,回到了人们的视野。
    1月10日,贾扬清在推特上表示,其创立的LeptonAI最近与HippoML合作,推出了全新的AIGC提示词撰写工具PromptLLM,用于帮助撰写AI绘图的提示词。
    图片
    1月15日,LeptonAI联合创始人、前阿里云开源大数据前端负责人谢亚东发推特表示,基于LeptonAI,开发团队只需要不到500行代码就可以实现Perplexity的效果,同时还附上了LeptonSearch的网址和截图。
    这是一款对标PerplexityAI的产品。
    图片
    图片
    提示词
    Lepton团队推出的PromptLLM是提示词生成工具,其ToC应用是一个名为PromptCraft的网页工具。用户只需输入一行简短的提示词,PromptCraft就能在几秒内生成一个更加完整、具体的提示词,顺便再用StableDiffusionXL生成两张图片。
    图片
    比如我们输入“spaceshuttleorbitingearth(绕地球运行的航天飞机)”,它就会给我们扩展成“SpaceshuttleinorbitaroundEarth,meticulouslydetailedwithintricatefeatures,aspectacleofengineeringmarvelsetagainstthebackdropofourblueandgreenballoflife,bathedinthegentlelightofthesettingsun,Photography,Capturedinultrahighdefinitionforasenseofraw,untouchedrealism”,生成的图片质感也很逼真。
    图片
    再比如我们输入“伊隆马斯克穿着夏威夷草裙跳舞”,它则帮我们扩充了人物表情、姿态、图片背景、摄影器材等细节,生成的图片效果如下:
    图片
    在官方的演示中,提供了不少精彩的案例,比如鹦鹉吃胡萝卜、驯鹿亲吻大鹅、狐狸穿袜子、山羊划船等,每一张图都是可以“即出即用”的程度。
    图片
    当然,在发布案例炫技的同时,贾扬清也不忘及时公布PromptLLM的API链接。从其定价页面可以看到,该工具推出了基础版(免费)、标准版($30/月)和企业版三个版本,根据使用模型的不同,每100万个Token的定价在0.1美元—0.8美元之间。
    PromptCraft的底层技术是LeptonAI团队和HippoML共同开发的,其中LeptonAI提供API平台支持,HippoML提供PrivateCanvas系统来保障运行。
    HippoML是一家做人工智能基础设施的公司,其目标是专注于降低人工智能软件堆栈的复杂性,让大型(河马,hippo)模型运行得像猎豹一样快。HippoML的主要产品是一个名为PrivateCanvas的应用,集成了StableDiffusion(XL,LCM),SDXLInpaint,SegmentAnything,ESRGAN,MI-GAN等大模型,可以让用户在本地就使用各种热门大模型的功能。
    该公司的创始团队来自Meta,其中包括BingXu和HaoLu两位华人科学家。
    图片
    而LeptonAI与HippoML之间的合作也并非首次。早在2023年8月,两家就合作推出了号称“最快”的SD扩散模型,同时将代码进行了开源。
    图片
    而在2023年12月,有眼尖的网友发现,LeptonAI小试牛刀,悄悄上线了一个很有意思的项目:tryemoji,该项目可以把emoji表情变成真实的图像、动画,还提供了不同风格的模板供用户筛选。
    图片
    贾扬清此前曾在播客中表示,不会做大模型创业,而是会更关注如何帮用户构建更好的AIGC应用,在AIInfra(AI时代连接硬件和上层应用的中间层基础设施,提供基础模型服务、赋能模型微调和应用开发)领域持续发力。
    图片
    AI+搜索,AI+一切
    除了提示词,LeptonAI还向AI搜索工具下手了。
    目前,AI搜索领域最明星的产品是PerplexityAI。不同于谷歌搜索出来的结果是链接,Perplexity会直接生成一段答案,并且在这段答案上方提供一个个附注链接(表明答案来源于这些地方),方便用户自己溯源。
    自2022年12月上线以来,Perplexity的产品一直稳定增长,在2023年10月推出订阅制服务后ARR达到了300万美元,月活在2024年1月达到了1000万,并以5亿美元的估值完成了由IVP领投的7360万美元融资。
    而就在最近,LeptonAI也做了一款类似于Perplexity的产品。
    图片
    创业邦在试用LeptonSearch后发现,给出的答案质量很高,且提供的信源质量也很高。
    图片
    LeptonAI的口号是“建立高效的AI应用平台(BuildAITheSimpleWay)”。除了PromptLLM和LeptonSearch这两款主打的产品,在他们的官网上,还有各种各样有意思的AIGC产品:
    图片
    比如OpenVoice,这是一个多功能的即时语音克隆工具,用户只需要输入一段文字,并且上传原始音频片段,就能生成和原说话者一样声音的音频内容,还可以选择不同的语气。
    图片
    比如SuperResolution,可以用人工智能生成无损质量的超高分辨率图片。
    图片
    再比如QR,可以生成各种各样的艺术二维码。
    图片
    图片
    开源斗士
    LeptonAI的创始人贾扬清一直是开源的摇旗呐喊者。早在深度学习框架Caffe刚刚出炉之时,贾扬清就力排众议,坚持将此框架开源;同时,他也是开源框架TensorFlow和Pytorch的核心成员和共同领导者。
    贾扬清此前曾经在公开演讲中指出,AI普惠的两个重要支撑,一个是工程化,另外一个是开源:从工程化角度,人们可以使用大规模的计算来寻找背后的统计学规律,无论是通过云原生的方式,还是更加高效的分布式计算,都让开发到迭代的路径变得更加简单;从开源的角度,开源让工作变得更加迅速、让整个市场变得更大,使得整体开发的效率提升、成本降低,进而实现共赢。
    也因此,LeptonAI一出生就带着“开源”的基因,不仅在所有的产品页面上都附上了API,更是用GitHub开源工具链SDK的方式降低了模型的使用门槛,让每一位AI开发者们通过一行命令即可拉起热门模型。
    图片
    而就在两个月之前,贾扬清还发朋友圈怒怼同行,表示有模型厂商套壳Llama,给下游客户造成了负担,也有损开源社区的自由度。
    图片
    消息一传开,各种Llama魔改的国产大模型纷纷躺枪,贾扬清迅速留言辟谣说不是老东家阿里。关于这一“大厂”究竟是谁目前仍然众说纷纭,但是很多人猜测是李开复创办的零一万物发布的大模型Yi-34B。
    此前就有网友在HuggingFace社区的Yi-34B板块讨论区留言说,除了两个张量(input_layernorm和post_attention_layernorm)被重新命名外,Yi完全使用了Llama的架构。
    图片
    零一万物是李开复在2023年7月趁着这波大模型热成立的新公司,Yi-34B是其在11月发布的首款预训练开源大模型。
    此事一出,零一万物负责人RichardLin回应称,“这个命名问题是我们的疏忽,在大量的实验中,我们对代码进行了多次重命名,以满足试验要求,但在推出发行版前没有把名字换回来”。同时,RichardLin还在回复中表示,将检查所有代码,加强流程管控,保证这样的失误不会再次发生。
版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权本站发表,未经许可,不得转载。

分享:

扫一扫在手机阅读、分享本文

标签列表