Что вообще происходит
За 20 минут — в курсе того, о чём все говорят
01Самый быстрый старт в истории
02Что такое ИИ на пальцах
Когда мы говорим «ИИ» в 2026-м, в 99% случаев имеем в виду LLM — большие языковые модели (от Large Language Model). GPT, Claude, Gemini, YandexGPT, GigaChat — всё это LLM.
Как они работают? Предсказывают следующее слово. Дай модели начало фразы — она спросит себя: «что обычно пишут дальше миллиарды людей в похожей ситуации?» — и выберет самое вероятное продолжение. Потом следующее. И ещё. Никакого «понимания» в человеческом смысле. Только очень качественная статистика по огромному корпусу текстов (Stephen Wolfram).
Метафора Андрея Карпати: LLM — это два файла. Первый — файл с параметрами (весами). Для большой модели — сотни гигабайт чисел. Второй — код, запускающий эти параметры. Обучение: берут терабайты текста из интернета, запускают тысячи GPU на несколько недель — и «сжимают» человеческое знание в набор чисел (Karpathy, YouTube).
⚡ ФактGPT-3 содержит 175 миллиардов параметров. Если печатать их по одному в секунду — потребуется 5 500 лет. Каждое число — крупица «опыта», который модель сжала из всего текста интернета. Ни один из них не «знает» ничего сам по себе — интеллект возникает из их взаимодействия. Как нейроны в мозге: один — ничто, 86 миллиардов — человек.
Загрузка…
Войдите, чтобы написать комментарий
Войти