以太坊联合创始人维塔利克-布特林(Vitalik Buterin)认可了新的图像令牌器(TiTok)压缩方法,认为其具有潜在的区块链应用价值。
新的 TiTok 压缩方法与社交媒体平台 TikTok 不谋而合,它能显著减小图像大小,使其在区块链上的存储更加实用。
Buterin在去中心化社交媒体平台Farcaster上强调了TiTok的区块链潜力,他说:"320比特基本上就是一个哈希值。小到足以让每个用户上链"。
这一发展可能会对个人资料图片的数字图像存储(PFP)和不可篡改代币(NFT)产生重大影响。

TiTok 图像压缩
TiTok 由 ByteDance 和慕尼黑工业大学的研究人员共同开发,可将图像压缩为 32 个小数据块(比特),且不会降低质量。
根据 TiTok 的研究论文,先进的人工智能(AI)图像压缩技术使 TiTok 能够将 256x256 像素的图像压缩成 "32 个离散代币"。
TiTok 是一种一维(1D)图像标记化框架,它 "打破了二维标记化方法中存在的网格限制",使图像更灵活、更紧凑。
"因此,它大大加快了采样过程(例如,比 DiT-XL/2 快 410 倍),同时获得了具有竞争力的生成质量"。

机器学习图像
TiTok 利用机器学习和先进的人工智能,使用基于变换器的模型将图像转换为标记化表示。
该方法使用区域冗余,即识别并使用图像不同区域的冗余信息,以减少最终产品的整体数据大小。
"生成模型的最新进展凸显了图像标记化在高效合成高分辨率图像中的关键作用"。
根据研究论文,TiTok 的 "紧凑潜表示 "可以产生 "比传统技术更高效、更有效的表示"。

TiTok,不是 TikTok
尽管名字相似,社交媒体平台 TikTok 并没有得到 Buterin 的认可。
这位以太坊联合创始人强调了 TiTok 的区块链潜力,为新的人工智能驱动的图像压缩方法增添了可信度。
"与将图像潜空间视为二维网格的现有二维 VQ 模型不同,我们提供了一种更紧凑的表述方式,将图像标记为一维潜序列。"
与 "二维标记化器 "相比,所提出的新方法可以 "用8到64倍 "更少的标记来 "表示图像",该团队希望这项研究能为 "更高效的图像表示法 "带来启示。