Математика для программиста
Нужна ли математика программисту?
Нужна. А, кроме неё, нужна сферическая геометрия, география, музыка и банковское дело. И я сейчас не шучу.
Дело в том, что программисты редко решают задачи для самих себя: мы работаем в банковских сервисах, сервисах бронирования отелей, картографических сервисах и прочих Яндекс.Почтах. Получается, что мы решаем задачи наших пользователей.
Для решения чисто программистских задач у нас есть алгоритмы и паттерны: если посмотреть на код интернет-магазина цветов и банковского сайта он будет очень похож. Будут использоваться одинаковые условия, одинаковые циклы и даже паттерн MVC будет один и тот же.
Важнее то, что стоит за этими вещами: понимание как работает система в целом. Если посмотреть на вещи с этой стороны, то станет понятно, что программист — это младший специалист в области, в которой работает сайт.
Ещё пять лет назад Артём Поликарпов доказал, что каждый фронтендер немного дизайнер. Нам нужно понимать как устроены шрифты: что такое гротеск, чем он отличается от антиквы, что такое интерлиньяж, кернинг, разрядка, капитель. Понимать, что такое сетки и что такое композиция. Кроме этого, разбираться в UX — мы должны знать что такое оптимистичный UI, где поставить прелоадер и зачем это всё нужно пользователю.
Но быть только дизайнером — мало. Дело в том, что пользователи взаимодействуют с нашими сайтами: в интернет-магазинах они вводят данные своих банковских карт, на картографических сервисах прокладывают маршруты и измеряют расстояния, на музыкальных сайтах они транспонируют тональность песен и настраивают гитару по тюнеру. И всё это должен кто-то запрограммировать. Получается, что у программиста должны быть специальные знания.
Например, правильность номера банковской карты определяется по алгоритму Луна — это теория кодирования.
Чтобы найти расстояние между двумя точками на карте, заданными широтой и долготой, нужно воспользоваться формулой дуги большого круга — это сферическая геометрия. Ещё этой формулой очень часто пользуются в морской навигации.
С картами, вообще, связано очень много интересного. Например, Яндекс.Карты используют эллиптическую проекцию Меркатора, а все остальные географические сервисы — сферическую, поэтому если вы захотите наложить слой Яндекс.Пробок на любую другую карту у вас не сойдутся улицы и вам нужно будет знать, как трансформировать одну проекцию в другую.
С кругозором понятно — изучайте всё, что хотите, потому что в любом случае это вам пригодится. Но есть ли какая-то общая область, которая нужна всем программистам? Да, такая область есть, она называется «дискретная математика». Наука, которая лежит в основе информатики.
Я не говорю, что нужно учить диксретку досконально. Для программиста важнее широта взглядов и понимание, где посмотреть, чем узкие знания в какой-то отдельной области. Но помнить несколько основных тем не помешает.
Во-первых, изучите булеву логику. Вы пишете условия каждый день и хорошо бы понимать, как они работают, например, для того, чтобы эффективно их упрощать.
Ещё одна хорошая тема из дискретки — это графы. Очень многие программистские задачи решаются с помощью графов. Даже скучный и привычный DOM — это дерево, частный случай графа. И здесь неплохо бы понимать хотя бы как по деревьям можно ходить.
Например, вы знаете, что querySelector использует поиск в глубину? Это значит, что когда он заходит на узел DOM-дерева, он пытается посмотреть сначала его дочерние узлы и только потом соседние. Это значит если вы будете искать с помощью querySelector первый элемент на странице, то необязательно это будет элемент верхнего уровня, найденный элемент может находиться на любой вложенности.
Ещё одна тема из дискретной математики — алгоритмы. Теория алгоритмов изучает что такое алгоритмы и оценку их эффективности. Представьте, у вас есть список людей, у которых вам нужно посчитать средний рост. Список задан в виде массива объектов.
Первое решение, которое может прийти в голову — это с помощью метода map собрать другой массив, массив ростов этих людей, а потом с помощью метода reduce посчитать их сумму и поделить на количество.
Но это решение будет неэффективным, потому что вы будете использовать два прохода по массиву, вместо одного. Вы могли бы сразу использовать reduce для того, чтобы сложить сразу все показатели по росту.
На деле оценка эффективности алгоритмов это немного более сложная тема, она учитывает и какой алгоритм вы используете и объём входных данных, но направление мысли вы поняли. Умение оценить эффективность алгоритмов поможет вам писать код, который будет хорошо работать или на старых телефонах и компьютерах или который не будет тормозить при работе со сложными алгоритмами, например, с большими визуализациями.
Итого: учите всё подряд, что попадётся вам под руку. Для начала изучите дискретку, потому что она будет вашим основным инструментом в работе, а потом сосредоточьтесь на задачах вашего бизнеса и вы откроете для себя очень много нового в бизнесе, математике, строительстве и медицине.
Насколько программисту нужно знать математику? Что думают в Яндексе
Почти в каждой школе в кабинете математики висит табличка с высказыванием Ломоносова: «Математику уже затем учить надо, что она ум в порядок приводит». Многим из тех, кто не понимает, что такое программирование, кажется, что писать код — это то же самое, что решать математические задачи, а все программисты — обязательно математики. Но как все обстоит на самом деле? Насколько помогает знание математики в решении практических задач?
Наконец-то мы добрались до одной из самых острых тем и задали нашим коллегам в Яндексе вопрос: «Нужно ли программисту знать математику?»
Под катом, как всегда, полная текстовая версия.
Михаил Парахин
Москва. Программирует 24 года. В Яндексе — 9 месяцев.
После окончания МИФИ начал работать в ЗАО НТЦ «Модуль». В 90-х это было почти единственное место в Москве, где занимались системами автоматического обучения. Потом ушел в компанию Parascript, которая фактически является монополистом в области распознавания рукописного и печатного текста. Долгие годы работал в США. Последние семь лет — в Microsoft, пять из которых возглавлял в Bing подразделение мультимедийных поисковых сервисов. Весной пришёл в Яндекс директором по поисковым технологиям.
Математику приходится знать. И обязательно надо знать хотя бы базовую часть в рамках первых двух курсов института. Мне как-то выпало в жизни узнать очень много статистики и, поскольку я системно занимался автоматическим обучением, пришлось много учить специализированной математики. В целом если ты не знаешь математики в рамках школьно-институтского курса, то жизнь программиста тебе не очень понравится.
Григорий bobuk Бакунов
Москва. Программирует 25 лет. В Яндексе — 10 лет.
Когда-то пришёл работать системным администратором, а сейчас — директор по распространению технологий.
Как ты думаешь, нужно ли водителю автомобиля знать, как он ездит? Мне кажется, что необходимо. Это реальная человеческая потребность. Нужно достаточно глубоко понимать, как работают даже такие банальные вещи, как системная библиотека. И, как ни странно, для этого до сих пор нужна математика. Есть определенный класс программистов, которым действительно это, наверное, не нужно. Можно привести простое сравнение. Есть люди, которые рисуют картины — их называют художники. Есть люди, которые красят заборы, — это маляры. Вот так же и с программистами: есть некоторый класс программистов, которые творят что-то высокое, а есть люди, которые красят заборы. И в конечном итоге их во многом отличает знание математики, умение тонко и детально понимать что же они все-таки пишут. Дальше выбор за человеком. Или ты начинаешь заниматься математикой, и тогда у тебя появляется шанс стать художником. Или красишь заборы — это тоже хорошая профессия.
Антон pg83 Самохвалов
Москва. Программирует 18 лет. В Яндексе — 9 лет.
Пришёл в Маркет программистом на C++. Работал над самыми разными задачами сервиса. Через несколько лет перешёл в поиск, где занялся надежностью и производительностью runtime поиска. Сейчас занимается системой сборки, которая позволит собирать всю нашу кодовую базу за несколько минут на большом распределенном кластере.
Вопрос в том, для чего ему знать математику? Для того чтобы объяснить компьютеру, что ему надо делать, математику знать не надо — надо знать язык и уметь им пользоваться. Но есть какие-то предметные области, где математику знать необходимо. Если бы я, например, писал Матрикснет или работал с ДНК, вполне возможно, что какую-то математику мне нужно было бы знать. Но вот в программировании — нет. Я не могу вспомнить, когда мои знания матанализа пригодились мне в написании кода. Но само знание математики заставляет людей писать лучший код. Все самые лучшие программисты, которых я знаю, обычно заканчивали какой-нибудь механико-математический факультет, а не ВМК. Видимо, обучение математике как-то так правильно вправляет мозг, что ты начинаешь лучше программировать.
Андрей styskin Стыскин
Москва. Программирует 18 лет. В Яндексе — 9 лет.
Пришёл в Яндекс разработчиком на Java в группу поиска Маркета. Занимался классификацией товарных текстов и извлечением фактов из товарных описаний. Так началось его увлечение поиском и машинным обучением. Вне работы Андрей делал различные IR-игрушки: генератор стихов на языковых моделях, робота для прокачки социальных сетей. Сейчас Андрей руководит отделом ранжирования, в котором работает команда почти из 200 человек.
Человеку нужно хорошо знать математику, чтобы быть программистом в Яндексе. Можно сказать, это часть нашего корпоративного духа. Если кто-то не может решить сложную задачку с собеседования, то его просто всерьез никто не будет воспринимать в Яндексе. По крайне мере в поиске точно так. Мне кажется, это самоидентификация, механизм, с помощью которого можно понять, что человек мыслит теми же категориями, говорит на том же языке, что и ты, поэтому ты сможешь работать с ним в команде. Я знаю много хороших разработчиков, которые не смогли бы в Яндексе выполнить ни один проект, но с аналогичными в других структурах справились бы прекрасно. Например, в Яндексе тоже делаются инфраструктурные проекты, которые могут делаться в том же Luxoft, но просто этих людей мы бы никогда не наняли.
Анатолий anatolix Орлов
Программирует 25 лет. В Яндексе — 9 лет.
Первые два года писал Маркет. Долгое время занимался поиском — в основном его производительностью, а потом и всем остальным. Сейчас занимается разными проектами в области скорости, архитектуры и т.д. Заместитель руководителя направления поисковых сервисов. Входит в 2% людей, которые заканчивают курсы на Coursera.
Математика — это большая область знаний, где есть части, которые в программировании нужны и не нужны. Если вопрос в том, существует ли что-то в математике, что нужно знать программисту, то да, конечно. А если он звучит как: «Есть ли что-то в математике, что программисту знать необязательно?» — то ответ будет тоже: «Да, такого много»… Например, дискретка очень нужна программисту, а матан за много лет мне в программировании ни разу не пригодился.
Степан Кольцов
Москва. Программирует 10 лет. В Яндексе — 7 лет.
Старший разработчик в службе разработки систем хранения и обработки данных. Стёпа из тех сотрудников Яндекса, которые уходили, но потом возвращались. Сейчас работает над системами мониторинга в поиске.
Зависит от того, чем человек занимается. Если он пишет что-то высокотехнологичное, то ему математику надо знать прям суперобязательно. Чем ближе человек, условно говоря, к поиску Яндекса, в котором у нас самые высокотехнологичные задачи, тем лучше нужно знать математику. Если он ближе к совсем прикладным задачам (например, пишет программы для банка, чтобы оптимизировать работу бухгалтерии), то математику, конечно, можно не знать. Мне очень нравится Яндекс тем, что у нас гораздо больше таких мест, где она все же нужна.
Андрей Мищенко
Москва. Программирует 24 года. В Яндексе — 9 лет.
Пришёл в Яндекс разработчиком на C++, долго был руководителем разработки Поиска по блогам и писал на Perl. Андрей — кандидат физико-математических наук. Сейчас работает с Андреем Гулиным над улучшением алгоритмов машинного обучения в поиске.
Смотря какие у программиста цели. Для решения некоторых задач нужно знать математику лучше, чем некоторые ученые, а для других она совершенно не нужна. Если ты занимаешься инфраструктурными, инженерными задачами, то тебе нужны совсем другие умения. Есть задачи, в которых гуманитарное образование тебе даже больше поможет, чем фундаментальное математическое. Особенно там, где ты больше всего работаешь с пользователями. Если ты разрабатываешь интерфейс, который должен быть удобен среднестатистическому пользователю, глубокое математическое образование будет тебе только мешать. Интерфейс будет очень стройнымм, но при этом совершенно неудобным. Ты должен уметь срезать углы, делать его не таким стройным и более гладким, чтобы он был более интуитивный.
Нужна математика в системном программировании на нижнем уровне, в каких-то хайтечных задачах. В том же машинное обучении, конечно, сплошная математика и статистика. Наверняка в криптографии тоже нужна очень глубокая математика. Таких областей хватает.
Александр sadovsky Садовский
Москва. В Яндексе — 10 лет.
Пришёл в Яндекс работать над проектами, связанными с поиском. Под его руководством были созданы поиск по блогам, Яндекс.XML, запущены новый алгоритм ранжирования и робот для оперативного индексирования свежей информации, создана служба асессоров и начато измерение качества поиска. Саша — автор множества публикаций в научных и популярных СМИ об алгоритмах поисковых систем и продвижении сайтов в интернете.
На мой взгляд, математика — очень мощная штука, которая может облегчать решение многих задач в программировании. И пусть программист не знает её на уровне математиков, но базовые знания высшей математики у него должны быть, чтобы общаться с теми, кто ее понимает, и уметь воспринимать ту информацию, которую передает собственно математик. Когда я работал в лаборатории, у нас был человек, который очень хорошо разбирался в математике, алгоритмах, оптимизации и мог построить хорошую математическую модель. Но если программист всего этого не понимает и тупо программирует один в один, как ему рассказали, результат получается не очень. Хорошо, когда два человека находят точки пересечения. Математика позволяет прикидывать в голове эффективность алгоритмов, то, за какое время они будут выполняться, позволяет лучше описывать объекты реального мира. В нашей области без математики невозможно создать такие алгоритмы, как Матрикснет.
Артём breqwas Киреев
Программирует 12 лет. В Яндексе — 8 лет.
В Яндекс позвали за то, что парсил данные из Поиска по блогам. Позвали не только поругать, но и на работу. Много лет делал Поиск по блогам, в частности был основным разработчиком подсервиса Яндекс.Пульс. Сейчас разрабатывает Рекламную сеть, один из самых критичных в смысле отказоустойчивости сервисов.
Я математику не знаю вообще. Причем это очень странная ситуация, потому что все, кто сидят вокруг меня, знают ее очень хорошо. Так что когда они начинают говорить какие-то умные вещи или когда у них на столах валяются бумажки, исписанные страшным даже не знаю чем, мне становится очень совестно. Но вот я математики не знаю, и ничего. Совершенно ничего хорошего, но без математики есть много задач, в которых её, серьёзную Computer Science, алгоритмы и все такое знать необязательно. Есть много прикладных задач, в которых это не нужно.
Сергей svv Вавинов
Москва. Программирует 27 лет. В Яндексе — 6 лет.
Пришёл в Яндекс разработчиком в Яндекс.Видео. Был главным в разработке Музыки, потом — в службе медиасервисов. Сделал несколько проектов для Яндекс.Диска. Сейчас — руководитель группы технологий работы с большими данными. Одна из задач, над которой работает Сергей, — проекты Яндекса для ЦЕРНа.
Программисту знать математику нужно обязательно. Конечно, бывает разное программирование, разные проекты, в некоторых математики нужно больше, в некоторых — меньше, в некоторых нужна специальная какая-то математика. Но базовое образование, базовое понимание математики необходимо просто потому, что она выстраивает мозги. У человека развивается абстрактное мышление, он может лучше смотреть на задачу, разбивать ее на какие-то части, понимать, как подходить к ней, искать какие-то новые подходы к решению – это в любом программировании важно. Еще есть некоторые совершенно базовые вещи. Например, оценка сложности алгоритмов. Её нужно уметь проводить в любой ситуации — какую бы программу вы ни писали, вам надо уметь ее оценить. Причем заранее, до того, как вы напишите код, чтобы просто понимать, нужно этот алгоритм использовать или вообще взять какой-то другой, чтобы он был более эффективным.
Роман Кашицын
Нижний Новгород. Программирует — 11 лет. В Яндексе — год.
Как и многие наши коллеги в Нижнем Новгороде, окончил ННГУ им. Н.И. Лобачевского. До Яндекса разрабатывал системы страхования, информационной безопасности, управления медиасерверами. Работал над ПО в телекоммуникациях, автоматизированными рабочими местами, порталами. У нас участвует в модернизации бэкофиса справочника организаций.
Такие вопросы часто задают известным хорошим программистам. Я считаю, что математика полезна, но необязательна. Ее очень полезно знать, особенно, если ты пишешь, например, на Haskell. Многие известные программисты не имели профессионального образования в области математики и писали очень хорошие программы. Скорее, программирование — это даже иногда такая лингвистическая работа; многие программисты были лингвистами, например. Но, с другой стороны, математика иногда очень помогает. Особенно если писать какие-то приложения, связанные с графикой. Там без высоких математических абстракций очень плохо. Матрицы, преобразования, кватернионы и всякие такие штуки очень нужны.
Елена Бунина
Москва. В Яндексе — 7 лет.
Директор отделения computer science в Школе анализа данных, HR-директор Яндекса, профессор кафедры высшей алгебры механико-математического факультета МГУ им. М.В. Ломоносова, заместитель заведующего кафедрой «Анализ данных» МФТИ. Доктор физико-математических наук. Тема её докторской диссертации «Автоморфизмы и элементарная эквивалентность групп Шевалле и других производных структур».
С моей точки зрения, есть разные программисты: те, кто просто по заданным алгоритмам что-то кодирует и может обойтись без математики, и все те, кто занимается анализом больших данных и теми вещами, которые есть у нас в Яндексе, — им математика нужна. Причем разные аспекты. Иногда даже нельзя представить заранее, какая математика им понадобится. Но уж точно те, кто имеет дело с машинным обучением, должен знать математику, должны хорошо владеть алгоритмами, и для них очень важны знания статистики.
Алексей Волохович
Нижний Новгород. Программирует — 25 лет. В Яндексе — 8 месяцев.
Лёша — руководитель нижегородского офиса разработки Яндекса. Окончил Нижегородский технический университет им Р. Е. Алексеева. Сейчас преподаёт там дискретную математику. Кандидат технических наук. До Яндекса занимался разработкой и программным менеджментом мобильных устройств.
Программисту знать математику в принципе важно, потому что те задачи, которые он решает, очень часто связаны со знаниями основным математических понятий. Писать код не означает ставить какие-то буковки, использовать какие-то операторы, функции и т.д., которые описаны в KPI. Можно написать такой код, который потом не сможет взлететь или, если полетит, то после этого упадет так, что развалится все, что под ним находилось. Поэтому закладывать красивые решения в самом начале проектирования системы — это основа основ. Для того чтобы получить это красивое решение, ты должен иметь базовые фундаментальные знания, понимать, в чем красота, в чем не красота, как посмотреть что данное решение оптимально для конкретного круга задач, которые решает твое программное обеспечение.
Михаил mlevin Левин
Москва. Программирует 18 лет. В Яндексе — 5 лет.
Вы могли видеть лекцию Миши о том, как математика помогает Яндексу зарабатывать. Очень большая часть его деятельности — работа в наших академических программах. Он преподает в Школе анализа данных, участвует в создании программы обучения на факультете Computer Science Вышки и Яндекса. Дважды завоевывал медали на ACM ICPC в составе команды МГУ им. М.В. Ломоносова.
Если хочется заниматься интересной работой, то математику нужно знать довольно хорошо. Есть определенные разделы (такие, как алгоритмы), которые требуют довольно глубокого знания математики и в общем-то отчасти математикой и являются. Мы все-таки считаем, что алгоритмы на каком-то базовом уровне должны знать все уважающие себя разработчики, и в общем-то в Яндексе на собеседованиях, по-моему, всех спрашивают алгоритмические задачки. Дальше уже зависит от направления деятельности. Если человек разрабатывает что-то инфраструктурное, то он может углубляться уже в системные вещи. Там своя математика тоже есть, но я про нее не очень много понимаю. Функциональные языки — это вообще то, над чем человек, не знающий математику, ломает голову, а какие-нибудь алгебраисты просто схватывают все на лету. Ну, и понятно, новые области машинного обучения — это вообще сплошная математика и там, конечно, можно просто применять инструменты, ничего в них не понимая, но тогда риск сделать глобальную ошибку, из-за которой вообще ничего не получается, очень большой.
Андрей Гулин
Программирует 25 лет. В Яндексе — 9 лет.
Пришёл в Яндекс программистом на C++. Первой задачей было переделать формат инвертированного индекса, чтобы записать в него информацию о точной форме слова в документах (до этого хранилась только лемма). Один из главных создателей Матрикснета, нашей технологии машинного обучения. Сейчас руководит службой ранжирования. Если бы Кнут не написал свой трехтомник, эту работу стоило бы отдать Андрею. Сам Андрей на вопрос, чем он занимается в Яндексе, ответил: «Я работаю за компьютером и делаю всякие штуки, чтобы всем было хорошо».
Конечно, знать математику необходимо. Тут коллеги смеются, настолько несуразный вопрос вы задаете. Но не очень понятно, можно ли не знать математику с нашей системой общего образования. Уже в первом классе всех обучают складывать, и это навык, который необходим и которым мы пользуемся постоянно. Математика не исчерпывается, как мы знаем, арифметикой — в ней есть много разделов с большей или меньшей полезностью. Некоторые изучают дифференциальную геометрию. Другие — сложные разделы математики, которые редко бывают полезны. В то же время есть разделы математики, которые считаются нетривиальными. Например, теория вероятностей, и хотелось бы, чтобы её знало как можно больше людей. Потому что она примерно так же полезна, как и обычная арифметика. Первая дает всем возможность посчитать, сколько денег нужно заплатить за обед и хватит ли их до конца месяца, а вторая позволит нам посчитать гораздо более интересные вещи. Например, какие у нас шансы на то, что нам удастся устроиться на новое место работы с большей зарплатой, что не отменят визы и мы сможем уехать в отпуск в этом году. Для в общем-то насущных решений вполне себе можно применять теорию вероятностей в полном объеме. Соответственно знать математику необходимо, и вообще, как мы знаем, математика — царица наук. И одна из самых абстрактных наук, которая вообще бывает.
Машинное обучение — всего лишь другое название статистики. Если вы занимаетесь статистикой, но с применением компьютеров, то вы занимаетесь машинным обучением. Математику вам придется ее знать, и даже если вы ее не знаете, вы ее изучите. Единственное, что необходимо, — уметь изучать новые области. Без этого навыка говорить, что вы хотите заниматься чем-то новым в своей жизни, невозможно. Машинное обучение было новым недавно, поэтому все, кто им занимался, имели этот навык. Прямо сейчас изучать машинное обучение намного проще, чем это было 10 лет назад, потому что написали много книжек, есть много курсов. Соответственно, если вы хотите заниматься не машинным обучением, которым занимаются уже примерно все, а чем-то совершенно новым, нужно уметь изучать новые области и выбирать те области, которые действительно нужны.
Мнений по поводу математики и программирования в Яндексе, на самом деле, гораздо больше. Здесь мы постарались показать, что в принципе они разные. И даже когда кто-то в одной части Яндекса считает, что без глубоких математических знаний невозможно работать, в другой свои задачи решают и те, у кого их нет. А что думаете вы? Мешало ли вам когда-нибудь то, что вы прогуливали матан? Или же математика вам каждый день помогает?