Happy Horse: От Anonymous AI Video Dark Horse до E-commerce Workhorse — Реалността зад SOTA Hype

Happy Horse (快乐马), видео моделът на Alibaba с изкуствен интелект, оглави анонимно глобалната класация на Artificial Analysis през април, надминавайки Seedance 2.0 на ByteDance. Но сивото тестване намали рекламата – разкривайки инструмент, създаден за масово производство на електронна търговия, а не за AI кино с общо предназначение.

Потребителите, които тестваха модела, установиха, че докато фиксираните близки планове и простите сцени създават качество, близко до екшън на живо, с остри детайли и реалистични текстури, сложното движение, движението на камерата и физическите взаимодействия разкриват значителни слабости.

“Фиксираните снимки в близък план на Happy Horse се представят добре, постигайки почти производствено качество в прости сцени, но се бори значително със снимките в движение и разбирането на физическите правила,” един рецензент каза на 市象. Подобна оценка се появи в институционално изследване: Happy Horse се нарежда високо по богатство на околната среда, пространствена дълбочина, текстура на материала и наситеност на цветовете, но се влошава значително, когато сложността на действието се увеличи.

Разликата между класацията и реалността се свежда до философията на продукта. Seedance 2.0 използва архитектура на дифузионен трансформатор с двоен клон — един клон за видео, един за аудио — ефективно професионален снимачен екип. Happy Horse използва архитектура на Transformer с един поток — на практика ефективна линия за производство на съдържание. Подходът с един поток е по-бърз и по-ефективен по отношение на изчисленията, но жертва стабилността при сложни задачи.

Числата разказват историята на ефективността: Happy Horse има 150 милиарда параметри срещу 220 милиарда на Seedance 2.0. Скоростта на генериране е 2–3 пъти по-висока от индустриалните норми; един H100 GPU генерира 5-секундно 1080P видео за 38 секунди; изчислителната консумация спада с приблизително 60%. Ценообразуването отразява това: Seedance 2.0 е ~1 юан/секунда, докато Happy Horse е 0,9 юана/секунда (720P) и 1,6 юана/секунда (1080P), с месечни планове съответно до 0,44 и 0,78 юана/секунда.

За разлика от конкурентите, насочени към производството на филми с изкуствен интелект, Happy Horse е роден от лабораторията за бъдещ живот на Taobao, фокусирана върху намаляване на разходите за производство на съдържание за електронна търговия. Основната му компетентност е точно съпоставяне на синхронизиране на устните на седем езика – от съществено значение за продуктови видеоклипове, търговия на живо и марково съдържание. Това е “ядат трева и произвеждат мляко” — чиста полезност за търговците.

Честното заключение: Happy Horse е високоефективен, евтин инструмент за производство на съдържание в кратка форма, оптимизиран за пакетно комерсиално видео – не AI филмовия режисьор, на който потребителите тайно се надяваха. Тези, които очакваха видео модел на ниво AGI, проектираха собствените си желания върху продукт, предназначен да изпраща реклами, а не да печели Оскар.

Source link

Like this:

Like Loading…

Нашия източник е Българо-Китайска Търговско-промишлена палaта

By admin