您的位置:中国外贸网 > 财经 >

阿里达摩院低调上线文本生成视频大模型:仅支持英文输入,已开放试玩

2023-03-22 17:24 来源: IT之家   阅读量:10127   

感谢IT之家网友大眼夹、打工轨道人、航空先生的线索投递! ,近日,阿里达摩院已在AI模型社区“魔搭”ModelScope上线了“文本生成视频大模型”。 根据官方介绍,目前文本生成视频大模型,由文本...

感谢IT之家网友 大眼夹、打工轨道人、航空先生 的线索投递!

,近日,阿里达摩院已在 AI 模型社区“魔搭”ModelScope 上线了“文本生成视频大模型”。

根据官方介绍,目前文本生成视频大模型,由文本特征提取、文本特征到视频隐空间扩散模型、视频隐空间到视频视觉空间这 3 个子网络组成,整体模型参数约 17 亿,目前仅支持英文输入。扩散模型采用 Unet3D 结构,通过从纯高斯噪声视频中,迭代去噪的过程,实现视频生成的功能。

官方介绍称,本模型适用范围较广,能基于任意英文文本描述进行推理,生成视频。一些文本生成视频示例如下:

A giraffe underneath a microwave.

A goldendoodle playing in a park by a lake.

据IT之家了解,模型已经在创空间和 huggingface 上线,可以直接体验,也可以参考该页面自行搭建。模型需要硬件配置大约是 16GB 内存和 16GB GPU 显存。在 ModelScope 框架下,通过调用简单的 Pipeline 即可使用当前模型,其中,输入需为字典格式,合法键值为 'text',内容为一小段文本。该模型暂仅支持在 GPU 上进行推理。

从试玩的结果来看,目前能生成的视频长度多在 2-4 秒,生成等候时间从 20 多秒到 1 分多钟不等。

郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。

精选 导读

以产业振兴促乡村振兴 砀山迈瑞科技产业园开工仪式举行

4月28日,砀山迈瑞医疗科技产业园开工仪式在安徽省砀山县顺利举行。宿州市委书记杨军,宿州市委常委、常务副市长任东,宿州市政府驻广东办事处主任...

发布时间: 2022-05-09 10:40

江西南昌:服装产业复工忙

5月3日,南昌创隆制衣有限公司的工作人员在车间进行拉布工序。随着江西本轮新冠疫情防控形势逐渐向好,各企业陆续复工复产。作为全国知名针织服装出...

发布时间: 2022-05-09 10:37

从业务全球化到品牌全球化 中国品牌“走出去”探索新价值

先进的液晶模组生产线、高频运转的生产设备、智能化的运营操控……今年4月,海信位于印度尼西亚首都雅加达的彩电基地正式投产,这也是中国企业从业务...

发布时间: 2022-05-09 10:34

助力煤炭清洁高效利用 我国煤气化制氢技术应用取得新进展

记者从中海石油炼化有限责任公司(以下简称中海炼化)获悉,我国煤气化制氢技术应用取得新进展,截至5月7日,位于广东惠州的我国首套采用E-Gas...

发布时间: 2022-05-09 10:34

全国粮食春播4.92亿亩进度过半

目前,粮食主产区正趁着天气晴好,争抢播种。全国春播粮食4.92亿亩,完成预定面积一半以上,进度快于去年同期。近两天,东北春播加快,日播种量超...

发布时间: 2022-05-07 10:23

天舟四号货运飞船和长征七号运载火箭已转场,感觉良好、整装待发

据中国航天科技集团官方消息,运载此次发射的长征七号五运载火箭与天舟四号货运飞船组合体,今天上午从总装测试厂房垂直转运至发射区,将于近期发射。...

发布时间: 2022-05-07 10:13