Мы познакомились с Алексеем Тихоновым в Яндексе. Пару лет я видел его только на рабочих совещаниях, мало что зная о нём. Он казался очень крутым, так что в какой-то момент я набрался смелости и предложил ему выступить с докладом на конференции «Пути Сообщения», которую организовывала наша группа транспортных сервисов. Алексей выступил, с тех пор мы стали больше общаться, и теперь я рад называть его своим другом. Правда, Алексей мне до сих пор кажется слишком умным для меня, и в том числе поэтому я постарался разобраться в его многочисленных делах и увлечениях в этом интервью.
— Когда я думал, про что с тобой поговорить, я всегда как-то озадачивался. Потому что у тебя, во-первых, интересов в десять раз больше, чем я знаю, это раз. А во-вторых, в части этих интересов я ничего не понимаю вообще. Но давай я всё же что-нибудь поспрашиваю, что доступно моему скудному гуманитарному сознанию.
— Пожалуй, да, у меня довольно странный и широкий спектр интересов, но я ни в каком из них себя не позиционирую как профессионал. Универсальным дилетантом быть достаточно удобно. Можно всегда притвориться очень глупым и не нести за это особой ответственности. При этом ты можешь довольно много чего узнать, попробовать, сделать.
— Я помню, что ты из Владимира. Ты там родился?
— Слушай, я не из... то есть я, конечно, из Владимира, но родился я в Германии.
— Ого, вот это неожиданно.
— Мой отец проходил службу в ГДР. И, собственно, до пяти лет я жил в Германии. А когда мне было пять лет, мы с родителями приехали во Владимир. И до окончания школы я жил во Владимире. А в 1997 году я уехал в Москву, учиться в МГУ.
— То, чем ты сейчас занимаешься, это такая штука, о которой вряд ли дети/подростки мечтают, в частности, в силу того, что это сложно сформулировать. Как ты к этому пришёл? Ты когда поступал в МГУ, как ты видел своё будущее?
— Я, во-первых, не уверен, что ты хорошо знаешь, чем я сейчас занимаюсь. В смысле, я не уверен, что мы это одинаково понимаем...
— Я тебя в большей степени, если по работе, воспринимаю как такого data-scientist, очень крутого аналитика, и в голове прикладываю к этому миллион твоих хобби и сторонних проектов, как-то так.
— Слушай, на самом деле, отчасти это везение. Во-первых, я ещё несознательным ребёнком понял, что мне нравится. Когда ты знаешь, что тебе нравится, дальше ты просто этим занимаешься, и тебя больше ничего не останавливает. Второе — мне везло на то, что я довольно регулярно находил интересную компанию единомышленников. Мой отец, будучи инженером-связистом по профессии, он наш первый компьютер спаял в 1985-м году. Это был компьютер «Микроша»...
— О, помню, помню.
— Отец полгода его собирал, потом он у нас где-то месяц работал, а дальше к нам пришёл очередной номер журнала «Радиоконструктор». В нём была схема компьютера РК-86, после чего отец разобрал «Микрошу» и ешё где-то полгода собирал РК-86. Так что в семье какое-то взаимодействие с компьютером, с такими древними компьютерами, было с 86-го года: всякие «Спектрумы» кассетные, дисковые «Пентагоны», «Профи», PC, модем, в доинтернетное время фидонет, BBS. А тогда всё это было всё ещё смещено по аудитории в сторону гиков — то есть если ты с компьютером, то ты автоматически гик. Если у тебя есть модем, то ты как бы очень гик. Ну и найти в небольшом Владимире таких же энтузиастов было несложно. Так что среди гиков (да и в семье инженеров) мне было с кем общаться, и сомнений, что я хочу в этом направлении развиваться, особо не было.
В МГУ я тоже довольно случайно попал. Мой дядя преподаёт во владимирском Политехе, завкафедрой. Он заканчивал мехмат МГУ, а его сын, мой троюродный брат, в этот момент уже учился в Москве — в ГАУ, это в Выхино, Государственная академия управления. И мне родители и дядя говорили, что там вроде неплохо, давай ты тоже туда попробуешь поступить.
Ну, вроде надо готовиться, а я очень люблю делать то, что мне интересно, и совсем не люблю делать то, что мне неинтересно. Государственная академия управления не вызывала у меня какого-то бурного восторга. Я начал как-то неторопливо готовиться, и вот наступило время предварительного экзамена — тогда была такая форма поступления «предварительные экзамены»: можно было заранее сдать профильный предмет, и если ты на нём получал большое количество баллов, то тебя брали безо всяких дополнительных экзаменов. И эти предварительные экзамены проводили весной. И я нужное количество баллов не набрал. Дядя подумал и сказал мне: «Слушай, вот есть ещё МГУ, там всё гораздо сложнее, зато там сроки поступления раньше, чем в ГАУ. Ты сейчас можешь поехать туда, попробовать сдать, чтобы потренироваться, и потом уже после этого ты спокойно сможешь поступить в ГАУ на основных экзаменах».
Поскольку мне мехмат вообще был никак не интересен, а ВМК вполне себе подходил, я подался на ВМК, пожил пару недель в общаге, пообщался с абитурой и какими-то студентами-третьекурами, которые на лето вписались во всякие ремонты, чтобы не уезжать из Москвы. И буквально за неделю общения я понял, что я не хочу ни в какой ГАУ, мне здесь прямо очень интересно: люди, движуха... Но там я опять завалил две предварительные математики, то есть набрал 8 баллов из 10 — а надо было 9 или 10 набрать по математике... А дальше там были литература и физика, с которыми у меня в школе были такие отношения, что меня преподаватели любили и не трогали, а я, соответственно, не особо учился... Но я собрался, подготовился и в итоге по полному набору экзаменов и поступил. Резюмируя, я посмотрел — мне, типа, нравится. Раз нравится, ну, надо фигачить.
МГУ. Рисунок Алексея Тихонова
— А ты можешь вспомнить какой-нибудь свой первый необычный проект, откуда всё началось? Или у тебя такого в голове нет деления?
— Деления как такового нет, потому что в конце 80-х/начале 90-х по сути все компьютерные проекты были интересными. Ты сначала играешь в какую-нибудь игру, потом она заканчивается, а хочется продолжения, так что ты начинаешь её с друзьями просто разбирать и переделывать, чтобы написать в ней свои уровни, потому что она тебе нравится. То есть такой довольно, в хорошем смысле, хакерский подход, когда тебе интересно, как всё устроено; интересно разобрать что-то, поменять, собрать обратно, сделать как-то иначе.
— Ты старше меня года на два-на три, и, слушая тебя, я понимаю, что эта разница сыграла свою роль, потому что у меня тоже были эти первые компьютеры — «Микроша», «Спектрум»... Но это всё было на более массовом уровне, и хоть и было ощущение некоторой избранности, но поступать на что-то компьютерное у меня не было желания. Максимум, что мы делали, это переозвучивали «Warcraft». Хотя, может быть, просто компания такая не набралась.
— Да я тоже считаю, что у меня тоже достаточно позднее было знакомство со всей этой историей, в том смысле, что люди, с которыми я в основном в школьные и студенческие годы какие-то интересные штуки делал, все минимум на два года старше меня были. Но в целом, конечно, вот этот подход «если тебе что-то интересно, надо разобрать, посмотреть, как это устроено» — достаточно продуктивен. Все же придумывают какие-то странные безумные идеи, но обычно все на них забивают, типа «а не сделать ли... да ну, потом...». А если не забивать и пытаться делать, то постепенно ты вырабатываешь привычку, что действительно даже самую бредовую идею, если она тебе очень нравится, вполне реально довести до какого-то результата.
Рекламная кампания Яндекса
— А когда ты оказался в «Яндексе», в каком году?
— В «Яндексе» я тоже очень случайно оказался.
— У меня ощущение, что там все случайно оказались.
— Да, наверное. Ну я точно очень поздно и довольно случайно. Я оказался там в 2010-м году. К этому моменту я закончил университет, аспирантуру в университете, параллельно с которой работал в нескольких разных конторах, несколько лет фрилансил, потом мы с приятелем открыли свой стартап в сфере финтеха, так скажем, когда это было не модно ещё. Мы занимались консалтингом и автоматизацией в инвестиционных компаниях, и мы даже пять лет проработали. В пике, по-моему, человек под 30 было у нас, но потом по ряду причин закрылись — проще всего, это конечно, спихнуть на кризис 2008 года, который привёл к тому, что следующий 2009 год был совсем грустный. Половина наших клиентов развалилась, половина свернула бюджеты на внешние проекты. И мы в итоге как-то просуществовали ещё годик, последние полгода платили зарплату сотрудникам условно из своих денег, ну а потом разошлись.
И вот в начале 2010-го года я вообще оказался в ситуации, когда мне почти 30 лет, и у меня нет работы. Причём работу я не искал лет 10, а то, что я искал до того, это было... ну, в 20 лет ты работаешь по-другому. Плюс, мне не хотелось больше заниматься скучными банковскими движухами: я видел много примеров, когда IT-специалисты в этом секторе сползают в болото за несколько лет. Но у меня была возможность несколько месяцев не идти в банк или разгружать вагоны, так как какие-то деньги были, плюс жена работала в этот момент, она могла какое-то время нас протянуть.
И я сел и стал думать, что я хочу дальше делать. У меня, например, есть такое правило, что я на конференции езжу только с докладом — чтобы себя мотивировать. Просто слушать не езжу, к тому же сейчас можно всё в интернете посмотреть. Но если уж ты идёшь на конференцию, надо чуть напрячься и что-нибудь придумать, что-нибудь сделать, довести до доклада. Я откопал пару своих интересных прошлых проектов, довёл их до понятного вида и съездил с ними на две конференции, такого больше технического, полухакерского плана. В итоге, понял, что, в общем, это тоже мне не очень уже интересно. Я решил, что чисто технарём-разработчиком я не хочу быть. Разработчик — это такая профессия, в которой ты постоянно конкурируешь с бодрыми двадцатилетними студентами в освоении новых языков: в год появляются один-два новых языка или фреймворка, которые надо быстро осваивать. Это в какой-то момент надоедает. А хочу я на самом деле какой-то центр интеллектуальной экспертизы собирать и растить. Словосочетания «Data Scientist» тогда вообще не было.
График частоты употребления словосочетания Data Scientist из Google Trends
И я решил, что я буду аналитиком, в смысле, что я хочу «думать головой» больше, чем «работать руками». Но тогда это вообще было непонятно что, и что такое «аналитик», тоже было не вполне понятно. Это приводило к интересным эффектам. Например, ты приходишь по слову «аналитик» на собеседование, а оказывается, что это аналитик логистики завода, производящего канцелярские принадлежности в Подмосковье. В другом месте приходишь, а там HR-аналитика — в общем, разброс очень сильный. Мне всё-таки хотелось остаться в IT. У меня была знакомая, которая давно работала в «Яндексе». Я ей написал: «А вам вообще не нужны какие-нибудь аналитики?»
Она мне ответила стандартным образом: «Иди на сайт company, там выбери, какая вакансия тебе нравится и напиши по ней...». Я сходил, выбрал какую-то странную вакансию вроде «стратегический аналитик Поиска», написал на неё тест, и потом мне месяц как обычно никто не отвечал. Знаешь, наверное, что есть такая критика яндексовых HRов, а в тот период был вообще глушняк. Мне потом Лёша Долотов рассказывал, что, вроде бы, за этой вакансией никакой позиции и не было, это был такой honeypot, муляж, чтобы странных людей приманить. Наконец, через месяц, когда я уже почти устроился ещё куда-то, меня позвали на собеседование в Яндекс, я пришёл, прособеседовался, не сказать, чтобы отлично, но как-то пообщались. И пока я там пообщался с людьми, опять поймал ощущение, что мне интересно, что мне понравилось, и надо дожимать. Прошло ещё недели две, и меня позвали на второе собеседование. Поговорили, в итоге решили меня взять. Вот так я попал в «Яндекс». Но, в общем, того «трушного Яндекса», стартапа из рассказов первопроходцев я не застал почти, это был уже бизнес-центр «Красная Роза» на Льва Толстого и все вот эти байки и легенды про Самокатную и прочее я уже в качестве мифологии потреблял.
— То есть сейчас, получается 10 лет как ты там?
— Да, осенью вот было 10 лет. 8 сентября я вышел на работу, помню как сейчас, потому что я вышёл аналитиком в Поиск, и в этот день Google внезапно запустил Instant Search — когда Enter не надо нажимать, у тебя ответ сразу появляется внизу в зависимости от того, что ты набираешь в поисковой строке. И вот я выхожу такой, ищу свой стол, а вокруг бегают какие-то незнакомые люди и кричат: «Что там? Срочно нужна аналитика для запуска конкурента!»
— Если подумать, то относительно широким массам — по крайней мере, чуть шире тех, с кем ты работаешь — ты известен в основном через «Нейронную оборону» и «Автопоэта». Это два довольно раскрученных явления, как ни крути. Они какую часть твоей жизни занимают?
— Знаешь, я раньше вот в этом месте всегда рассказывал нецензурный анекдот про Джона-строителя мостов.
— Да, да, да.
— Вот это как раз оно. Если серьёзно, то... У меня мотивация, наверное, устроена не так, как у многих, то есть мне охват, популярность проекта и моё имя на нём не настолько важны, насколько важно, чтоб получилось, так как мне видится правильным. То есть, если у меня есть в голове картинка финального результата, и если я смог доделать до этого состояния — отлично, задача решена. Дальше мне уже не так интересно тратить на это время. Если это ещё кто-то взял и использует — вообще шикарно, что кому-то пригодилось. Ну, и всё, я дальше иду. Поэтому забавно, что самые громкие проекты получились совершенно случайно, в моменте они большого времени у меня не отнимали, а потом они часто уже совсем без меня существуют.
Что касается «Автопоэта»: идея была довольно простая, я тогда очень много работал с поисковыми запросами, как говорится, «когда у тебя в руках молоток, всё вокруг похоже на гвоздь». В общем, в какой-то момент рабочего помутнения я решил, что было бы смешно эти поисковые запросы автоматически зарифмовать, и сделал первый драфт за четыре ночера. Я хотел, было, писать эвристику фонетической транскрипции, но хороший аналитик должен быть достаточно ленивым и хитрым, чтобы не делать всё самому с нуля. Я решил сначала спросить у наших лингвистов, есть ли у них фонетические эвристики. Конечно, у них была, и крутая. Я взял готовую у Юры Зеленкова, он несколько лет пилил свою эвристику фонетической транскрипции для русского языка. Я её переписал на питон, слегка переделал под свои нужды. Ну и дальше оставалось придумать и прикрутить эвристику рифмы и определение размера. Дальше я написал пост во внутреннюю рабочую соцсеточку, нагенерировал для него примеров, там же выложил несколько мегабайтов стихов и скрипты. С тех пор они лежат в репозитории, люди периодически ими пользуются, чтобы еще что-то сделать. То есть по сути, всё моё участие в «Автопоэте» этим и ограничивается, а дальше это дело как бы подхватили на флаг энтузиасты и пиарщики, начали пытаться что-то еще получить интересное. Пару раз я и сам к нему возвращался, когда у меня были новые идеи — самое заметное было, кажется, когда я решил новостные заголовки порифмовать.
Рисунок Трурля и Клапауция
— Ты про «Нейронную оборону»-то расскажи. Тут на самом деле я хотел к разговору про музыку перейти, это был вступительный вопрос из этого блока.
— Это совсем другая история. Мне в какой-то момент стало интересно разобраться, как современные нейросети работают. Как это ни странно звучит, когда я был студентом, я застал закат нейросетей. Когда я поступал, нейросети тогда были очень модной темой. На нескольких кафедрах ВМК занимались разными аспектами, в том числе, ряд очень уважаемых академиков. И вот буквально за несколько лет пока я учился, это направление быстро деградировало — к этому моменту было показано, что там экспоненциальная сложность, очень дорогое обучение, и железа не хватает на что-то серьезнее, чем простые примеры. И прямо при мне все эти подразделения и направления исследований начали схлопываться.
График частоты употребления словосочетания Neural Networks из Google Trends
А примерно с конца 2013-го года начался мировой ренессанс нейросетей. Но и вся эта новая эпоха нейросетей тоже очень сильно завязана на железо, на дорогие GPU-карты, и на очень большие объёмы данных. Это ведёт к тому, что сложно заниматься этим в одиночку, на домашнем компьютере. Слишком много ресурсов нужно. Конечно, можно читать статьи, изучать чужие результаты, но чтобы что-то делать самому, нужно вкладывать ресурсы.
Я задумался и осознал, что там, где картинки и звук — там гиблое дело для одинокого экспериментатора. Очень дорого, огромные датасеты. А вот с текстами всё несколько более компактно, да еще и на тот момент успехи нейросетей в работах с текстами были значительно скромнее. Значит, по идее, можно что-то хитрое сделать даже на домашнем компьютере. Осталось придумать что-то интересное.
И я решил в это всё как-то погрузиться, а для этого придумать какую-то модельную задачку. Так как я до этого занимался «Автопоэтом», мне пришла в голову несложная мысль, что можно попытаться погенерировать поэзию. Но не просто поэзию, а было интересно сделать поэзию в чьём-то стиле. Кого бы ты ни взял, даже Пушкина, то его текстов для того, чтобы выучить нейросеть, недостаточно. Она даже орфографию не сможет выучить, слишком маленький корпус текстов. Поэтому там используется интересный трюк, сейчас уже банальный, в общем, общепринятый, когда ты берёшь большой-большой корпус всех вообще доступных текстов, и на нём учишься, и параллельно или отдельно учишь сеть стилизации под конкретного автора. Это похоже на то, что называется transfer learning, но тогда я этого не очень знал. Я пару месяцев приставал с расспросами к Илье Едрёнкину, он крутой специалист в этой области и тогда работал в Яндексе над синтезом речи. Он подсказывал мне, чего почитать, какие архитектуры и библиотеки изучить и так далее. Довольно быстро стало понятно, что результаты выходят интересными, но не очень осмысленными... То есть образы выходят яркими, тексты выходят стилистически похожими, более того, стиль люди распознают, автор-прототип действительно каким-то образом воспроизводится. Но одна беда: смысла никакого там, конечно, нет. В итоге довольно осознанно был сделан выбор в пользу любимого в юношестве Егора Летова. Во-первых, это действительно музыка детства, а во-вторых, это как раз пример той поэзии, где часто смысл человек воспринимает на уровне образов. Тут эффект парейдолии, кто-то, например, в кофейном осадке видит человеческое лицо, это пример того, что люди вообще натренированы извлекать смысл из структуры, из контекста. И даже если прямого смысла особо нет, всё равно способны извлекать, допридумывать.
В итоге удалось сделать какое-то количество стихов, которые действительно были достаточно прикольными и субъективно похожими на «Гражданскую оборону». Я показывал их Ване Ямщикову, мы их вместе отбирали, а он как раз настоящий музыкант, в отличие от меня, и он загорелся идеей это записать. Он для этого специально покупал какие-то примочки, читал и смотрел старые интервью Летова, чтоб понять, как надо расстроить гитару, чтобы она правильно атонально звучала. И в итоге у него, кажется, неплохо получилось. Я приехал к нему на домашнюю студию, и мы записали с ним несколько треков. Ваня их свёл и сделал весь необходимый пост-продакшен. Я попросил нашего товарища Пашу Гертмана (тоже бывший яндексоид) сделать эскиз обложки, а потом, когда треки уже были записаны, оказалось, что у Паши есть кассетный магнитофон, и по нашей просьбе он сначала записал треки на кассету с песнями Летова, а потом оцифровал звук обратно. Этим мы с одной стороны добавили каких-то дополнительных контекстов, а во-вторых мы получили вот этот узнаваемый в любых старых записях нойз лентопротяжного механизма, там местами слегка подтягивает звук, и из этого, мне кажется, получился очень милый штрих. И именно в этом виде оно поехало во всякие айтьюнсы и Яндекс.Музыку.
Обложка «Нейронной обороны» работы Паши Гертмана
— А сколько всего было проектов? Я так понимаю, что «Нирвана» потом была, и какой-то локальный «Мумий Тролль» был, или их в итоге было существенно больше, просто нам о них неизвестно?
— Из крупного помимо «Нейронной обороны» через год мы с Ваней сделали ещё «Нейрону», в смысле трибьют на «Нирвану», который технически почти ничем не отличался, то есть сеть переучили на английский язык и всё. Мы сделали несколько песен, было интересно, полетит оно так же весело или нет.
— Полетело?
— Кажется, немного полетело и зависло. Это вот как раз история про то, что такие громкие проекты скорее спонтанно получаются, а когда ты пытаешься их специально спланировать, часто получается хуже. Мы реально делали кастинг на вокал, попробовали пять вариантов исполнения. Ваня Ямщиков и четверо внешних людей. Мы искали людей, которые похожи по голосу на Курта Кобейна, искали, в том числе, «в холодную», по youtube, писали им, заставляли их записывать какие-то треки, чтобы оценить похожесть. В результате нашли Роба в Нью-Йорке, он профессиональный певец, заказали ему четыре трека, он записал для нас. Мы за пару недель придумали и сняли клип на одну из песен, в нём человек в маске методично разбивает гитарой старый компьютер, на котором играет классический клип Кобейна. Сам процесс организации всего этого был очень интересным, конечно.
В общем, это был интересный опыт, и не сказать, что совсем бесполезный. Целей никаких мы не ставили, это был творческий эксперимент, так что и провалиться он не мог. Он, например, попал в галерею воркшопа AI Creativity на конференции NeurIPS. NeurIPS — это довольно мощная, в топ-2, мировая конференция по нейросетям, и там есть такое маленькое отделение, называется «AI Creativity workshop». Среди всяких цифровых художников и музыкантов это довольно модное место, и вот наш проект туда попал.
— Давай сдвинемся к немножко более аналоговой музыке. А ты сам играешь чего-то на гитаре?
— Так получилось, что я в детстве-юношестве не научился нормально играть... У меня отец очень хорошо играет на гитаре, а вот я только лет пять-семь назад завёл гитару и начал на ней учиться играть — ну так, скорее для себя. Понемногу, на серьезные занятия времени не хватает. Но вообще в списке дел у меня есть еще продвинуться в обучении — хотя бы до уровня «играть и петь какие-то песни, которые мне нравятся».
— Меня впечатлила рассказанная как-то тобой история, что ты в студенчестве перед тем, как куда-то ехать, изучал специально, есть ли в городе рок-клуб и что там за музыканты играют. Можешь чуть подробнее рассказать?
— Надо начать с того, что в плане музыкальных вкусов у меня довольно широкие и странные интересы, но никогда не было единомышленников в полном смысле этого слова. То есть у меня есть друзья, которые хорошо в русском роке разбираются, у меня есть друзья, которые достаточно хорошо в электронной музыке разбираются, но нет сильного совпадения по интересам ни с кем, если брать весь спектр... И по этой причине у меня, так скажем, нет какого-то явного подходящего коммьюнити, чтобы обсуждать музыку. Скажем, у меня есть друзья, с которыми я с удовольствием обсуждаю книги, а вот в музыке я сам варюсь, и как-то последние лет пятнадцать я развлекаюсь тем, что очень много слушаю разной случайной музыки. Я слушаю её фоном один раз, удаляю 90 процентов из плейлиста сразу же, может быть, даже не дослушивая до конца трек или альбом, а потом то, что остаётся, я слушаю ещё раз. И уже выбираю то, что уже мне по каким-то причинам нравится.
— А тебя хватает? Просто я уже понял с годами, что меня на такой конвейер не хватает. То есть я могу конечно какую-то первичную обработку с первого раза производить, но КПД всего этого какой-то бесстыдно низкий.
— Обычно всё-таки у меня несколько проходов, три как минимум. У меня результатом этой деятельности, идёт, во-первых, лонглист — это то, что прошло две-три проверки, причём ещё желательно в разном настроении. Первый проход идёт обычно под работу, он в сознании не зацепляется обычно, и времени не отнимает, но если в такой ситуации вдруг что-то зацепило, мозг включается: «О!», то вот это оставляем. То, что я до этого три часа слушал и ничего не услышал, фактически можно сразу удалять. А второй-третий раз я уже сажусь и более внимательно слушаю то, что отобралось, и ещё раз прореживаю.
И вот это накапливается, в хороший месяц 10-15 треков откладывается, и оно входит в вот этот лонглист. У меня есть древний айпод, в котором на непрерывном шафле музыка, отобранная мной за 15 лет. Вот там всё вот это вот, что я так или иначе по каким-то причинам когда-то посчитал более или менее интересным. Иногда полная чушь, или что-то проходное, но я не буду её уже оттуда удалять. Это радио, это просто моё личное радио, которое по каким-то причинам вот так сложилось. А из него я уже делаю годовые подборки, когда из нескольких сотен треков, найденных за год, выделяю штук 30-50, которые достаточно интересны, чтоб про них можно кому-то что-то рассказать. Ими я делюсь с друзьями.
Но даже случайную музыку надо как-то находить. Чтобы находить вот эти какие-то интересные штуки, нужно, чтобы объём входящей музыки был регулярно большим, и это было бы не то, что уже в ротации и в высокопопулярных каналах и источниках. А такое обеспечивать себе довольно сложно, нужно находить какие-то приёмы.
Это был широкий заход на ответ про поездки. В общем, поэтому время от времени я действительно перед поездкой куда-нибудь или после поездки куда-нибудь совершаю какие-то тематические набеги, ну типа «вот в этом городе или в этой стране есть какие-то странные и интересные штуки?». Вот есть ли в природе, я не знаю, исландский дабстеп? Что нам может предложить интернет по этому словосочетанию? Можно послушать какое-то количество и найти что-то интересное.
— Меня скорее удивило, что ты пишешь, условно говоря, про орловский рок-клуб. То есть это вроде просто, но как-то мне в голову не приходило. Я столько ездил, но в рок-клубы как организации никогда не заходил.
— Когда я был студентом, у меня появилось хобби кататься на выходные или на один день куда-нибудь по России, куда можно доехать. Начиналось всё довольно тривиально просто потому, что в общаге живёт куча друзей — кто-то из Твери, кто-то из Тулы, кто-то из Смоленска, кто-то ещё откуда-то. И к ним можно съездить, вписаться на выходные, не проблема. Потом со временем эта вся история эволюционировала. Я начал развлекаться примерно таким образом: «а давайте на выходных поедем в город ...», и смотришь, куда можно доехать на электричке, или ночным плацкартом. И вот решаешь с друзьями куда ехать. Поедем в Дубну, например. Кто-то уже был в Дубне? Никто в Дубне не был. Значит, надо ехать в Дубну. Поехали! А что там есть вообще? Полезли в интернет читать, выяснили, что в Дубне есть всего одна гостиница и с ценами примерно московского уровня, потому что это наукоград, и там соответственно живут в основном иностранные гости конференций. Короче, гостиница отпадает. Что ещё есть в Дубне? Посмотрели, полазили — а, вот, в Дубне есть 50 общаг! Значит, будем пытаться в общагу вписаться. Следующая мысль — а что мы там будем делать? Ну там вроде официальных достопримечательностей нет, потому что город молодой. Ну да, там есть памятник Ленину, есть взорванный памятник Сталину, но во-первых, его найти нетривиально... Нужен язык.
Соответственно, в те времена ты открываешь ICQ и пишешь стандартный текст, примерно такой: «Мы студенты из Москвы, собираемся приехать в ваш город на выходные погулять. Скажите, пожалуйста, что интересного есть в вашем городе — куда сходить, чего посмотреть?». Через встроенный поиск ищешь людей, у которых местом жительства указан город Дубна, и кто сейчас онлайн. Допустим, находится 30 человек. Ты им копипастом отправляешь это сообщение. Двадцать ничего не отвечают, пять отвечают типа «ничего у нас нет, и не надо к нам ездить», из оставшихся пятерых трое рассказывают что-то: куда надо сходить посмотреть, где интересно, где неинтересно, и обычно пара человек говорит: «Слушайте, а давайте мы вам сами покажем город». Мы такие, конечно: «Отлично! Скажите, как вас найти, мы приедем — вам позвоним». И по такому принципу, в общем, может довольно много интересного найтись и произойти. Я потом ещё научился — ищешь городской форум какой-нибудь, но не туристический, а именно для своих. Там обычно в какой-нибудь ветке «Прочее» есть тема вроде «А где вы любите гулять?». И народ там пишет свои какие-то секретные места, куда можно сходить, чтобы что-то интересное увидеть. Вот в Самаре, например, нам про вертолётную площадку рассказали, а в Екатеринбурге я узнал из такого форума про метеорологическую горку, откуда очень классный вид на город, но она ни в каких списках достопримечательностей не существует, мы туда почти час шли через промзону и гаражи, но в итоге не пожалели. В общем, по такому принципу всегда что-то субъективное и уникально про город выцепляешь, что действительно помогает почувствовать, как город устроен. Особенно, если тебя местный водит. Это как я во Владимире могу показать, за каким углом надо повернуть, чтобы ты прям такой: «Ой, блин, как так может быть, что я только что шёл по обычной улице, и вдруг вот так». И таких мест несколько, и их тоже в путеводителе не прочитаешь.
Ещё, случается, находишь достаточно уникальные локальные онлайн-сообщества. Помню, я с интересом читал сайт tmarena.ru, это был такой внутренний коллективный блог тверской компании молодых интеллектуалов с уклоном в анархию, закрылся в году в 2005. Или было такое закрытое сообщество МегаЛуки (портал в стиле Лепры, но полностью про жизнь в городе Великие Луки, закрылся в 2017, потом был удалён). Когда находишь такое место, там можно поймать местных живых и интересных людей, они интересно рассказывают и часто предлагают компанию и экскурсию по городу.
Так вот, и местная музыка тоже добавляет субъективной привязки к местности. Гуляешь и слушаешь что-то, что было прямо здесь и придумано. Или наоборот, после возвращения думаешь: «Интересно, какие в этом антураже группы, песни?». Ищешь и иногда что-то очень интересное находишь.
— Круто. Надо тебя как-то во Владимире отловить.
— Конечно. А в конкретной Дубне была забавная история. Описанным выше образом я познакомился с ныне покойным крутым товарищем по фамилии Мазный, и потом оказалось, что это один из первых айтишников Дубны, то есть они там в 70-е первые БЭСМы какие-то собирали, на них физику ядерную моделировали... Ну такой Привалов примерно, знаешь, из Стругацких. Я потом находил в каких-то странных углах фидонета какие-то юморески его, их стенгазету «Импульс», стихи про айтишников семидесятых годов.
Но тогда я этого всего не знал, возраст у него в ICQ не был указан, а по нику «mazny» я даже не догадался, что это фамилия. Я ему пишу: «А где у вас там вписаться можно?». Отвечает: «В моё время в палатках тут в лесу рядом вписывались». Я говорю: «Ну да, а в общагу-то можно какую-то?». Он: «Сходи в такую-то попробуй». И мы туда приехали, и нас вписали. А потом, когда нас местные ребята водили по академгородку и вдруг такие: «А вон Мазный пошёл!». Такой дедок с характерным седым хвостом пробежал куда-то, немного на Андрея Себранта похожий. Так что, мы его даже увидели, хотя лично и не общались.
— Круто. Слушай, а напомни про историю с обкатыванием всех станций московского метро за один день? Она в итоге удалась на 100 процентов?
— Всё удалось отлично, мы объехали всё честно по тому маршруту, которому запланировали, ехали даже быстрее, потому что в ряде случае успевали выйти, сфотографировать и ехать потом в том же поезде.
Команда Метромарафона
— А вы на всех станциях выходили, получается?
— Мы были на всех станциях, мы были даже во всех залах. То есть если где-то на станции несколько залов, то мы были на всех, которые на тот момент работали. Станций было, кажется, 199, а 200-я была Фрунзенская, которая в тот момент была закрыта на ремонт. Зато мы видели пару служебных туалетов — нас сопровождали ребята из службы мобильности Метрополитена, и они нам дважды позволили воспользоваться служебными удобствами. Так что на поверхность мы ни разу не выходили за всё время. Точнее, мы были на поверхности там, где открытые станции, но ни разу не выходили за турникет.
— А сейчас это было бы реально? Сейчас чуть ли не две с половиной новые ветки открылись. Там был какой-то резерв по времени?
— Слушай, ну мы стартовали с открытия и вышли в город в 10 вечера, то есть как минимум 3 часа запаса было. Потом открытие новых веток, как ни странно, в каких-то случаях может даже сэкономить время, потому что часть веток тупо едешь обратно, ибо нет хорд. Появление хорды позволяет тебе как минимум не тратить время зря. В общем, не могу сказать, не считал, но выглядит потенциально реалистично и сейчас. Не уверен, что МЦК туда войдёт, потому что оно само по себе довольно большое, и интервалы довольно большие.
— Да, выходить на каждой муторно, конечно, ну так проехать-то можно.
Расчёт маршрута Метромарафона
— Ну да, проехаться вообще без проблем. А ты видел, кстати, я не так давно делал в «Жалких Низкочастотниках» пост про узел?
— Слушай, ну я читаю «Низкочастотники», но иногда я их внимательно читаю, а иногда где-нибудь по ходу работы, поэтому про узел я не очень помню.
— Короче говоря, я увидел... Есть такой британский стендап-математик, у него есть канал «Numberphile», нумерофил. Он там разные прикольные штуки делает. И они в прошлом году в сентябре, кажется, решили найти, есть ли на топологии лондонской подземки узел. В смысле, чтобы в пространстве тоннели заплетались так, чтобы образовывать узел. Вот, я когда это дело увидел, то впечатлился и собрал такой узел на московском метро. То есть тоннели так проложены, что там есть узел, классический трёхлистный. И где-то минут за 90, наверное, его можно проехать.
Узел на схеме Московского метро
— Если мы уж перешли к каналу... Чего сейчас ты делаешь ещё из интересного? Вот история про гербы была. Есть какие-то такие планы, которые можно рассказывать? Идеи?
— Слушай, этот канал это же вообще не про планы совсем. Это вообще довольно случайная штука такая, он получился из нашего чатика на пять человек, где мы друг другу интересные ссылки кидали, и как-то так вышло, что, в основном, я кидал. И упомянутый уже Паша Гертман мне как-то сказал — давай, короче, ты лучше канал сделаешь. Я отвечаю: «Кто его читать-то будет?». И тут мы вспомнили наш древний мем, который в 2010-м году в Поиске придумали — мы называли аудиторию интересных, но слишком странных и заумных штук «жалкими низкочастотниками», и тогда же решили, что это хорошее название для гаражной панк-группы. Паша сказал — вот так и надо назвать канал. И был прав, конечно. И конечно, всё это вообще не про планы, это просто место, куда я периодически что-то интересное сбрасываю — что-то что сам сделал или просто увидел. А интересного вокруг очень много.
— Давай спрошу про осмысленность. Явно, что есть какие-то условно промышленные или бизнесовые применения вот этих всех историй с нейросетями, искусственным интеллектом. А что еще? Та штука, которую ты сделал с распознаванием животных, потом с теплоходиками, они все очень клёвые, но вот например, не очень понятно, что с ними дальше делать. Я показал распознавание теплоходов знакомым речникам, они сказали: «Вау!», посмотрели, прикололись, а дальше не очень понятно, что делать. Есть ли какое-то движение на тему того, чтобы какие-то условно гуманитарные потребности соединялись вот с такими техническими возможностями? Может быть, полотна неизвестных художников идентифицировать по каким-то стилевым особенностям...
— Мне кажется, почти во всех этих историях есть бизнес-применение, есть какое-то количество смысла. Постоянно какие-то стартапы появляются на разные схожие темы. В тех же камерах есть разные учёные-орнитологи, которые похожими технологиями пытаются сейчас пользоваться. Они расставляют камеры, фотоловушки, потом распознают типы птиц, собирают датасеты разных птиц, изучают миграции и так далее. Есть истории в духе «Лизы Алерт», где тоже сейчас, насколько я слышал, уже применяют нейросети... Вертолёты пролетают при поисках людей, с воздуха делают снимки. Люди смотрят эти снимки сами, но если у тебя есть автоматическая система, которая спотит какие-то подозрительные, похожие на человеческое тело объекты, это сильно помогает. Сейчас стартапов, которые пытаются это так или иначе внедрять и продавать, довольно много. Я этим не занимаюсь просто потому, что если уж чем-то заниматься, то надо серьёзно заниматься. Как у классика, «если уж что-то делать, то с толком». Всё остальное бросать и в какую-то такую историю уходить с головой. У меня есть основная работа аналитика в «Яндексе», она поглощает основное моё время, и эта работа интересная. Конкурировать с ней не так просто.
— А у тебя есть какие-то глобальные цели? Ты хочешь продолжать делать то, что тебе интересно, максимально долго, насколько ты сможешь? Или всё же есть какой-то глобальный проект, который хочется сделать?
— У меня есть какие-то направления, в которых мне сейчас интересно развиваться, и я стараюсь ими заниматься в свободное время. В первую очередь, сейчас это, наверное, работа с естественно-языковыми текстами: анализ, генерация, изменение. В частности, автоматическая стилизация текста. Это такая довольно большая история, и зайдя в неё несколько лет назад, в общем, с улицы, я прилично продвинулся. По крайней мере, по собственным оценкам. Какие-то статьи пишу с товарищами, по основным конференциям езжу. Не то, чтобы это было целью, но это интересная мне область и пока что я продолжаю в ней развиваться. А на сдачу с этого получаются какие-то интересные странные проектики, иногда просто курьезные поделки, которые я выкладываю в канал, Например, недавно вышла сгенерированная моими нейросетями книга «Paranoid Transformer».
Разворот книги «Paranoid Transformer»
Есть какие-то более глобальные направления такие, не очень прикладные. Я сильно интересуюсь генерацией сюжетов, работа с нарративом, сюжетами, с динамической структурой сюжета... С точки зрения практического применения там очень широкое поле возможностей. Например, ты играешь в какую-то компьютерную игру, и она автоматически изменяет свой сюжет так, чтобы лично тебе было интереснее. То же самое с сериалами и фильмами... Это до какой-то степени и сейчас происходит, но в ручном режиме. Люди сидят, придумывают какие-то возможные продолжения, снимают пилоты, и летом, когда между сезонами сериала пауза, показывают фокус-группе, собирают оценки. После чего принимают решение об изменении сюжета, скажем, это домохозяйкам нравится, значит, вот сюда пойдём, а здесь не понравилось молодёжи — туда не пойдём. Это всё очень интересно, потому что там поле непаханное для автоматизации, для каких-то новых решений. Сейчас совсем мало результатов в этом направлении, но я верю, что в ближайшие лет 10 это изменится.
— А что за история с этой книгой, Paranoid Transformer?
— Много лет каждый ноябрь проходит ежегодное соревнование по автоматической генерации текста, NaNoGenMo. Надо за месяц написать и опубликовать код, генерирующий литературный текст длиной 50 тысяч слов — столько, чтобы исключить желание его вручную поправить. В прошлом году я решил поучаствовать и собрал комбинацию из двух нейросеток: первая — генератор текста, обученный на всяком киберпанке, афоризмах и непростых текстах вроде Кафки и Руми. Дальше мы с Ваней Ямщиковым прочитали несколько тысяч фраз, сгенерированных этой сеткой, и вручную разметили их на «хорошие» и «плохие». И я натренировал вторую нейросетку отличать «хорошие» от «плохих» и сделал из неё фильтр, отбраковывающий скучные и корявые фразы и оставляющий интересные и неожиданные. В результате вышел довольно годный генератор параноидального бреда на кибернетические темы.
После завершения NaNoGenMo мне написали товарищи из очень странного журнала генеративной литературы DEAD ALIVE, сначала позвали к себе на конкурс, а потом, когда я его выиграл, предложили эту штуку издать в виде книги. Под это дело я придумал, как использовать ещё одну нейросетку для генерации дрожащего почерка, нервность которого зависит от эмоциональности текущего текста. Потом добавились другие мелкие штрихи — например, ещё одна нейросеть рисовала на полях каракули, контекстно связанные с текстом в этом месте, ну и кучка других маленьких моментов. Всё вместе это собралось в такой вот дневник безумного робота, бредящего об окружающей его действительности. Я написал паре крутых людей, за деятельностью которых следил много лет, попросил их написать рецензии. В итоге предисловие сделал Ник Монтфорт, поэт и профессор цифровых медиа в MIT; а послесловие — Люба Эллиотт, продюссер и куратор разных проектов в области креативного AI.
В общем, получился забавный атмосферный проект, который в итоге даже дошёл до печати книги. По результатам, как водится, мы написали пару околонаучных статей, а сам проект пару недель назад опять попал в AI Art Gallery того самого воркшопа на конференции NeurIPS, куда 3 года назад попадала наша Neurona.
— Давай так, последний вопрос попсовый, уж извини. Они, конечно, все попсовые, но этот особенно. Многие очень люди, которые не в теме изнутри, считают, что искусственный интеллект — это такая опасность для человечества. У тебя есть какое-то понимание, когда искусственный интеллект станет действительно сильным и станет ли он вообще?
— Слушай, это правда очень попсовый вопрос. Давай так сформулирую — никакого «искусственного интеллекта» в принципе нет, пока ты не определишь, что такое «интеллект» вообще, или «естественный интеллект» в частности. То есть, ты можешь подставить вместо него там... «рептилоида с Нибиру» или «умножение матриц» или любое другое словосочетание. Не в том смысле, что не существует каких-то машинных методов, а просто само по себе словосочетание лишено какой-либо семантики. Изначально его придумали как сказку такую, что в далёком будущем, значит, будут машины, которые будут думать как люди, а потом этим словосочетанием стали называть какие-то вещи, которые люди умеют делать, а машины не умеют.
Например, лет тридцать назад распознавание речи считалось искусственным интеллектом, и автоматическое решение задачи «что за животное на картинке?» называлось искусственным интеллектом. По мере того, как какие-то методы появлялись, это переставало быть искусственным интеллектом. Сейчас распознавание и генерация речи — это не искусственный интеллект. Распознавание и генерация изображений — это не искусственный интеллект.
Искусственный интеллект в каждый момент — это то, что всё ещё люди умеют, а машины нет. Какое-то время назад считалось, что чтобы выиграть в го, нужен интеллект. Ну, выиграл компьютер в го, а искусственного интеллекта как-то вроде не прибавилось. На самом деле, от счётов, от абака, текущий современный искусственный интеллект пока отличается лишь количественно, не качественно.
— Объёмами!
— Объёмами, размерами, скоростью работы. И отсутствием самостоятельности. Ключевая вещь, которая обычно пугает людей, на самом деле — самостоятельность машин, потенциальная самостоятельность машин. Самостоятельность в постановке целей и выборе способов их достижения. И в этом месте за последние несколько десятилетий ничего особо не поменялось. По-прежнему для того, чтобы машина могла распознавать картинки, животных на картинке, ты, человек, должен собрать миллион картинок, разметить их вручную и сказать: «Машина, ты должна угадывать надписи, которые на этих картинках». Вот это она будет делать, и очень эффективно. Лучше, чем человек.
Но процесса самостоятельного дообучения, процесса самостоятельной постановки целей, исследования какого-либо протяжённого существования в отрыве от конкретной задачи, его пока нет. В этом месте очень много перспектив, научных, философских и так далее. Но то, что попадает в прессу, это, в основном, буллшит. В общем, никакой угрозы я тут не вижу. А вижу огромный фронт работ для полезного внедрения машинного обучения, нейросетей и робототехники во всех областях человеческой жизни — от сельского хозяйства и производства лекарств, до искусства и развлечений.
Спасибо Андрею Порядину за помощь в подготовке интервью.