DeepSeek: дешевий китайський чат-бот шокував світ ШІ BBC News Україна

Categorise


DeepSeek: дешевий китайський чат-бот шокував світ ШІ BBC News Україна

Ці хлопці створювали штучний інтелект з машинним навчанням для торгівлі на біржах акцій. Що ж відомо про цей продукт і чому він влаштував справжній переполох на ринку ШІ? Простими словами, DeepSeek – це розмовна ШІ-модель, яка здатна генерувати тексти різних обсягів та в різних жанрах, шукати інформацію в інтернеті, а також створювати код. У середу, 29 січня, Федрезерв оголосить рішення щодо грошово-кредитної політики.

DeepSeek: що це за нейромережа, як спробувати її безкоштовно і чим вона краща за ChatGPT?

У п’ятницю, 31 січня, Мінторгівлі США опублікує дані щодо індексу споживчих цін (PCE) за грудень. Консенсус-оцінка передбачає, що за останній місяць 2024 року роздрібні ціни, без огляду на продукти харчування та енергії (індекс Core PCE), зросли на 0,2%, порівнюючи з листопадом, і на 2,8% — у річному вимірі. У четвер, 30 січня, Європейський центральний банк повідомить рішення щодо грошово-кредитної політики. Трейдери впевнені, що ЄЦБ зменшить базову відсоткову ставку на чверть відсоткового пункту. Минулого року регулятор знизив ставку чотири рази, починаючи з червня, та довів її до 3%.

“Ми не очікували, що ціноутворення виявиться настільки чутливим питанням”, – пояснив він в інтерв’ю China Academy. При цьому поки що залишається повністю безкоштовним, що неймовірно тішить користувачів. Зауважимо, зараз додаток DeepSeek посідає друге місце в топ-чарті українського App Store. Схожа ситуація і у Google Play – у DeepSeek уже понад мільйон завантажень. Котирування біофармацевтичної компанії Summit Therapeutics, Inc. (SMMT) зросли до рекорду за всю історію торгів. Лян каже, що був здивований реакцією на попередню версію своєї моделі ШІ.

Якщо прямо зараз зайти на тести на lmarena.ai, то в загальному рейтингу перед нею три моделі — дві від Google, одна від OpenAI. Також вчора вийшла модель o3 mini, ще немає її в рейтингах, але з того що я встиг перевірити, її робота мені більше подобаєтся за DeepSeek. Особливість DeepSeek — архітектура MoE (Mixture of Experts), яка має плюси і мінуси. Плюс в тому що вона дуже швидка, бо для запиту активується лише 37 млрд параметрів з загальної кількості у 671 млрд. Мінус слідує також з цього — коли модель використовує лише 5% від загальної кількості параметрів, то і результати не завжди є стабільно високими.

Навчання моделей штучного інтелекту, на кшталт ChatGPT та DeepSeek, забезпечують сучасні чипи. Проте з 2021 року уряд США посилив обмеження на продаж сучасних чипів до Китаю. Думаюча модель добитися кращих результатів для складних задач, однак насправді не завжди потрібна, бо виходить дорожчою і повільнішою за «звичайні» моделі. І якщо з якоюсь задачею гарно справляється модель звичайна, то вона і буде найкращим вибором. Попри відсутність серйозного прориву у світі нейромереж, реліз останньої версії DeepSeek можна назвати тихою революцією. У якому напрямі піде розвиток NVIDIA, AMD та їх конкурентів — залишається лише гадати.

  • Наприкінці грудня 2024 року на ринок вийшла модель DeepSeek-V3, а в січні відбувся реліз ще більш досконалої версії DeepSeek-R1.
  • При цьому ви так само можете користуватися нейромережею DeepSeek прямо в браузері ваших мобільних пристроїв, не звантажуючи програму.
  • По суті інтерфейс DeepSeek копіює ChatGPT, включно з дизайном значків.

Загальне падіння акцій майнінгових компаній може також негативно плинуло на вартість біткоїна оскільки інвестори починають хвилюватися щодо фінансової стабільності основних гравців у цьому секторі. У Gemini та сама проблема — безплатна версія відстала у розвитку від платної Advanced. Нейромережа далеко не так добре розуміє контекст, читає між рядками й гірше справляється з рутинними завданнями, наприклад, з автоматизацією бізнес-процесів.

Статті на цю ж тему

Схоже ситуація з діпсіком вийшла з під контролю і стала схожа на параною. Інформації повно — коректної не завжди, тому зробив невеликий Гайд/FAQ по темі. Крім того, через зниження вартості обчислень, DeepSeek відкриває можливості для масштабування ШІ у deepseek аі Web3-проєктах, що може стимулювати розвиток криптоекономіки загалом. Токени, що залежать від високопродуктивних графічних процесорів (GPU), зокрема Render (RENDER), The Graph (GRT) та Fetch.ai (FET), зазнали падіння на 11-15%. Продовжуючи взаємодію з нашим сайтом, ви погоджуєтесь з використанням файлів cookie нами та політикою конфіденційності. Сотні незалежних тестів показали, що за функціональністю та продуктивністю ця нейромережа виявилася анітрохи не гіршою за GPT-4o.

Як вплине “Цусіма російської авіації” на війну та обстріли України

CNBC пов’язує ралі космічних компаній з ентузіазмом інвесторів щодо повернення Трампа до Білого дому. У своїй інавгураційній промові новий президент США коротко торкнувся теми і космосу. Це призвело до появи моделей ШІ, яким потрібно набагато менше обчислювальної потужності, ніж раніше. Це також означає, що вони коштують набагато менше, ніж вважалося за можливе раніше, що може перевернути галузь. DeepSeek була заснована у 2023 році Лян Веньфеном в Ханчжоу (місто на південному сході Китаю). 40-річний випускник факультету інформаційної та електронної інженерії також започаткував гедж-фонд, який підтримав DeepSeek.

Консенсус-оцінка Barron’s передбачає уповільнення зростання ВВП до 2,6% у річному вимірі із 3,1% у третьому кварталі. У вівторок, 28 січня, Бюро перепису населення США оприлюднить доповідь щодо попиту на товари тривалого користування за грудень. Ринок припускає, що обсяг нових замовлень на ці товари зріс на 0,8%, порівнюючи з листопадом, повідомив Barron’s. Минулого понеділка SMMT оголосила, що пізня стадія досліджень її препарату від раку Ivonescimab показала зниження ризиків прогресування захворювання або смерті на 49%, порівнюючи з ліками Keytruda, які виробляє Merck.

Це перше зниження ділової активності з вересня і найрізкіше за останні п’ять місяців, пише Trading Economics. І це при тому, що Пекін уже здійснив низку заходів щодо підтримки місцевого бізнесу. Попри короткочасний негативний вплив, є й позитивні аспекти для крипторинку. Головний із них – зниження витрат на запуск блокчейн-рішень з ШІ.

Наразі DeepSeek працює тільки всередині власних додатків і сайту. Наприкінці грудня 2024 року на ринок вийшла модель DeepSeek-V3, а в січні відбувся реліз ще більш досконалої версії DeepSeek-R1. У четвер, 30 січня, Бюро економічного аналізу (BEA) Мінторгівлі США повідомить попередню оцінку зростання найбільшої економіки світу за четвертий квартал.

У понеділок, 27 січня, Національне бюро статистики Китаю опублікувало індекс ділової активності у виробничому секторі за січень 2025 року. Аналітики Baird у п’ятницю підвищили рейтинг акцій Twilio із нейтрального до Overweight, еквівалентного рекомендації «купувати», а цільову ціну паперів підвищили зі $115 до $160. Так інвестори відреагували на прогноз прибутку компанії найближчими роками, повідомив CNBC. «Ми слідуватимемо нашому очевидному призначенню до зірок і відправимо американських астронавтів встановити зірково-смугастий прапор на планеті Марс», — заявив Трамп.

Він почав скуповувати графічні процесори Nvidia ще до того, як США заборонили їх експорт до Китаю. “В умовах неминучого посилення обмежень перевагою США є доступ до більш досконалих чипів”, – вказують аналітики компанії. «Додаток має стати тривожним дзвіночком для наших галузей, що нам потрібно зосередитися на конкуренції, щоб перемогти».

Якщо раніше штучний інтелект сприймався як допоміжний інструмент, то тепер він стає партнером, який розуміє контекст, передбачає потреби та допомагає приймати правильні рішення. DeepSeek — це не просто інструмент, це новий підхід до вирішення завдань. Він поєднує швидкість, точність і гнучкість, що робить його незамінним для бізнесу будь-якого масштабу. Аналогічним чином реєстрація проходить і при завантаженні програми. При цьому нічого не заважає вам користуватися одним обліковим записом як у браузері на ПК, так і в мобільному додатку на смартфоні або планшеті.

Крім того, компанії, які почали диверсифікувати свій бізнес коштом хостингових рішень для ШІ, такі як Hut 8 та Iris Energy, також відчули негативні наслідки. Запуск R1 створив конкуренцію в цьому сегменті, оскільки ця модель ШІ від DeepSeek продемонстрував ефективність обчислень навіть без використання найбільш передових процесорів. Це посилило тиск на компанії, що орієнтуються на інфраструктурні сервіси у сфері ШІ. А от якщо говорити про «дистильовані» варіанти моделі, то тут є варіанти під різне залізо, вони, звичайно, не обіцяють такий же результат, як оригінальна, але загалом працюють непогано, бо «мислячий механізм» у них присутній. Я запускаю їх з LM Studio, є ще інші варіанти, наприклад, ollama. Особисто в мене досить швидко і якісно працює варіант на основі LLama 8B.

Leave a Reply

Your email address will not be published. Required fields are marked *