Клуб выпускников МГУ (Московский Государственный Университет) |
Трудности перевода
В проекте StartUp «Итоги» продолжают рассказ о самых успешных и харизматичных предпринимателях, начавших свой бизнес с нуля. Знакомьтесь: основатель компании ABBYY Давид Ян, который заставил компьютер прочесть «Войну и мир» Журналисту наш герой кажется родной душой - большая часть его профессиональной жизни связана с печатным словом. Программа FineReader, распознающая тексты на 189 языках, электронные словари Lingvo, помогающие переводить и изучать 20 иностранных языков, - все это создано командой ABBYY. Основатель компании Давид Ян рассказал «Итогам», откуда в нем такая тяга к лингвистике и чего стоит построить бизнес на языковом фундаменте. - Давид, ваше увлечение лингвистикой из детства? Вы ведь росли в интернациональной семье. - Действительно, моя мама - армянка, папа - китаец. Но важнее то, что оба они ученые, и уже с третьего класса я мечтал стать физиком, как они. Участвовал в олимпиадах и после физматшколы поступил в МФТИ. Мой научный шеф - Всеволод Феликсович Гантмахер, ныне академик РАН, работал в Институте физики твердого тела АН СССР в Черноголовке. Под его руководством я занимался исследованиями в области физики твердого тела. Но при этом хотелось ходить на дискотеки и купить джинсы и кроссовки. У родителей денег на это я не просил, вот и возникла идея заработать. А идея такая. Написать в июле программу - словарь, англо-русский и русско-английский, в августе продать 100 экземпляров программы по 100 рублей каждый, заработать кучу денег и в сентябре вернуться к занятиям на пятом курсе. - Тогда уже можно было продавать программы? - Это был 1989 год. Шла перестройка, и организации уже что-то могли приобретать, правда, по безналу. В начале июля мне удалось найти программиста - Саша Москалев работал в соседнем институте в Черноголовке. Он подумал и сказал: я напишу программу, а ты будешь ее продавать. И еще я взял на себя задачу обеспечить словарную базу. Я сразу описал некий язык, с помощью которого нужно разметить текст словаря, чтобы программа могла автоматически вычленить заглавное слово, синонимы, антонимы, пометы и т. д. Впоследствии это получило название DSL (Dictionary Specification Language - язык спецификации словаря). Сейчас на нем ведется много различной работы, а тогда мы просто набросали страничку на бумаге, переписали от руки второй экземпляр и разошлись - каждый со своим листочком. Нашел деньги - три тысячи рублей, по тому времени большие, годовая зарплата моего отца, профессора, и кооператив, который согласился перевести содержимое словаря с бумажного носителя на электронный, создать электронную словарную базу и предоставить нам права на публикацию. Кооперативу в наследство от советских времен достались машинный зал с бобинами, на которых сохранялись данные, и операторы ввода - их было человек 30. Вся эта структура раньше входила в состав какого-то НИИ. Наборщики текстов работали вслепую - у них была только клавиатура. Но чтобы помнить, где они остановились в ходе работы, у каждого был мониторчик размером в один символ - с помощью курсора можно было прокрутить в этом окошке текст, вспомнить, в каком месте остановился, и продолжить набор. Правда, они сами недооценили объем работ. Обязались все сделать до 1 сентября, а в реальности сдали работу только в апреле. У словаря ведь очень сложная структура. В отдельной инструкции было расписано, какими спецсимволами нужно помечать, скажем, авиационную промышленность. Более того, у клавиатур не было верхнего и нижнего регистров. Каждый раз, когда встречалась заглавная буква, она тоже помечалась спецзнаком. Это была эпохальная работа. Но в нашем с ними договоре была заложена неустойка на количество ошибок. Но не была оговорена максимальная сумма этой неустойки. И выяснилось, что ошибок у них столько, что вместо трех тысяч, которые мы должны были заплатить им, получилась неустойка на четыре тысячи. Руководитель кооператива умолял: люди работали девять месяцев, нужно им что-то заплатить. Я ему отвечал в том смысле, а что же делать нам. Сидели, препирались. А дело в том, что еще в августе прошлого года я уже продал, как собирался, этот словарь. Правда, не 100, а три экземпляра. Но не по 100, а по 700 рублей. И у нас уже был договор продажи на 2100 рублей. А продукта не было. Заказчик спрашивал: где словарь? Что делать? Мы с Сашей садимся и начинаем править базу сами. Вообще-то днем мне надо было учиться, а ему работать. Поэтому правили по ночам. И вот доходим до буквы «К», а ее нет нигде. Наборщики о ней то ли забыли, то ли схитрили, не знаю. А ведь в словаре это огромный объем! Что остается делать? Сели и начали вводить сами. Это было что-то ужасное! В конце концов загрузили в программу, и Lingvo начала переводить! Вводишь русское слово, она выдает английское, вводишь английское, получаешь в ответ русское. Счастье мы испытали бесконечное! - Заказчик тоже был счастлив? - Мы запаковали дискеты и отправили к заказчику гонца. Это был Арам Пахчанян, мой одноклассник. У меня не было денег на билет до Еревана, а Арам как раз летел домой. А связи - никакой, мобильных телефонов еще не было. Только потом мы узнали, что он там пережил: приходит к заказчику, устанавливает систему, запускает программу, она спрашивает у него пароль, а мы в суматохе этот пароль сказать забыли. Вот сидит он, перед ним черный экран DOS и строка «введите пароль», а вокруг приемная комиссия заказчика, между прочим, большого серьезного НИИ в Ереване. - И он выкрутился? - Свершилось чудо! Мне кажется, физтехи могут все. Он ввел VELAKSOМ, и программа приняла этот пароль! Как он догадался, что Москалев задал в качестве пароля свою фамилию, написанную наоборот?! Но все получилось. НИИ перечислил деньги, даже не стал брать неустойку за девятимесячную задержку. С задержками, проблемами программа Lingvo начала продаваться. Не за месяц, правда, а за год заработали 10 тысяч рублей. А к окончанию первого года обнаружили, что на рынке существует около 50 тысяч нелегальных копий нашей программы. - Как это выяснили? - Я взял телефонный справочник Академии наук, звонил в каждый институт и предлагал программу-переводчик - словарь Lingvo за 700 рублей. Вначале меня слушали, а к концу первого бизнес-года в каждом третьем месте, куда мы звонили, отвечали, что у нас уже есть Lingvo и не надо нам говорить, что вы ее разработали. Украли, наверное, и пытаетесь продать. Нам, конечно, льстило, что программой уже пользуются… И еще мы поняли, что словарь словарем, а источник того, что надо переводить, - на бумаге. И человеку без знания английского языка достаточно сложно набрать на клавиатуре текст для перевода. Вот было бы здорово сделать всеобъемлющий продукт - от бумажного листа на одном языке до бумажного листа на другом языке! Скажем, вставляешь в сканер книжку на английском языке, нажимаешь несколько кнопок на компьютере, и из принтера выходит книга, распечатанная на русском. Это была мечта. Но мы попытались ее реализовать. - Каким образом? - Объединили четыре программы, три из которых лицензировали у других производителей. Первая - программа сканирования. Вторая - корректор, проверяла орфографические ошибки после сканирования. Еще одна не наша программа делала подстрочник, и, наконец, четвертая - собственно Lingvo. С ее помощью можно было сделать нормальный перевод. Весь этот комплекс мы назвали Lingvo Systems, и он начал продаваться еще лучше. В разы. И стоил в разы дороже. Однако вскоре мы поняли, что качество работы распознавалки текстов нас не устраивает. Константин Анисимович, один из авторов Lingvo, предложил сделать свою распознавалку. Первая реакция была: ты сошел с ума - целые научные школы занимаются этим десятки лет. Но он объяснил, как это сделать лучше: программу не надо будет учить каждому новому шрифту. Ведь тогда, прежде чем распознать, скажем, «Войну и мир», нужно первые десять страниц обработать в режиме обучения системы. Но если где-то в середине встретится что-то напечатанное другим шрифтом, программа опять этого не поймет, вновь придется обучать. А наша будет понимать все шрифты сразу. И мы решили такую программу сделать. Начали проект в 1992 году, а в 1993-м выпустили первый продукт. И в первый день продали 40 коробок с ПО FineReader, а за первый месяц - 800! Это было просто немыслимо по тем временам. Теперь-то у нас лучшие ученые в компании работают, и тот первый FineReader 1993 года не идет ни в какое сравнение с сегодняшним. Сегодня, если взять листок с текстом, программа его не просто распознает, но и сверстает в точно таком же виде в формате файла pdf с такими же картинками, такими же заголовками и т. д. Но в 1993 году это был прорыв. И еще одна новинка, которую мы тогда реализовали: мы научились отличать русскую букву «р» от латинской буквы p, буквы «о» английские и русские, заглавные и строчные, а также цифру 0. Эти пять символов, хотя и выглядят одинаково, имеют совершенно разные коды для использования в компьютерных программах. - Долго почивали на лаврах лучшей распознавалки? - Это не совсем так. В первой версии мы уступали конкурентам по точности распознавания. Но зато она умела распознавать двуязычные тексты, и ее не надо было обучать. И в тот момент это оказалось важнее. К 1995-1997-м годам программа начала побеждать не только в России, но и в Америке, и в Европе на английских текстах. Тогда мы приняли решение о выходе на зарубежный рынок и ребрендинге компании. Мы стали называться ABBYY. - Давид, а что было в это время с учебой? - Вся эта история началась на летних каникулах после четвертого курса. И пятый курс я проучился, почти не посещая институт. Мой шеф Гантмахер был очень недоволен. Он сказал: «Давид, вам надо определиться». Я пришел в деканат и попросил академический отпуск, обещая, что завершу за год историю с Lingvo и защищу диплом. Прозорливый декан сказал: «Вы за год ничего не закончите. Не надо себя обманывать. Мы вас отчислим, а когда завершите свои дела, приходите, восстановим». Он сдержал слово, меня отчислили в 1990 году. Через два года я понял, что появилось время для продолжения занятий в вузе, и вернулся в институт защитить диплом. - По физике? - Нет, по математике. Тот самый язык описания словарей, который начался с первых пяти страничек, лег в основу диплома. А кандидатскую диссертацию по физматнаукам я защитил по рукописному распознаванию. Тоже в МФТИ. С одной стороны, я бросил физику. С другой стороны, меня радует, что мы все не бросили науку. То, что делаем, как выяснилось, это серьезная наука, которая называется Computer Science и Artificial Intelligence (искусственный интеллект). Распознавание, семантика текстов - это сегодня очень горячие темы. - Вы сами к этому пришли или рядом оказался кто-то из научной среды? - Сами. Руководит разработками по-прежнему Костя Анисимович. Возглавляет компанию Сергей Андреев. Они пришли в компанию в 1990-1991 годах. - Когда завершился захват российского рынка? - В конце 90-х годов мы в России имели более 80 процентов рынка по распознаванию текстов и словарям, и тогда основной наш фокус сместился на международный рынок. Тогда обороты у нас были не очень большими. Планку в 5 миллионов долларов по выручке мы преодолели, кажется, году в 2000-м. - А первый миллион когда был? - Наверное, году в 95-м или 96-м. Перед кризисом 1998 года. Проскочили эту дату как-то незаметно. Мы не распределяли дивидендов очень долго. Всю прибыль вкладывали в развитие. Изначальная движущая идея джинсов и кроссовок очень быстро отпала. Конечно, какие-то зарплаты мы себе выплачивали, но достаточно скромные. Ездили на «Жигулях». Вокруг многие преуспевающие бизнесмены покупали дорогие машины и квартиры, а я жил на съемной до 1998 года. Выбор между тем, чтобы купить свою или пустить эти деньги на то, чтобы создать новую технологию, решался однозначно. - Семья такой выбор понимала? - Семья состояла из меня и моей супруги Алены. Алена - выпускница факультета ВМК МГУ, один из сооснователей компании и один из первых сотрудников. Поэтому мы ночевали буквально на работе. Первый офис был в нашей съемной квартире. До 1995-1996 годов снимали под офис трехкомнатную квартиру в Южном Измайлове. Жили в углу самой дальней комнаты за шкафом. Было смешно, когда готовили себе яичницу в то время, когда приходили клиенты. Офис ведь начинал работать, как положено, утром. А мы просыпались часам к 11 после работы до 4-5 утра и пробирались на кухню, пока клиент смотрит в другую сторону. У нас еще и кот был. В квартиру набивалось человек 15 сотрудников. Очень плотно стояли столы с компьютерами. Практически все те люди, которые начинали компанию, до сих пор в ней работают. Более 50 человек - те, кто работает свыше 15 лет. Нельзя сказать, что мы специально создаем какую-то творческую атмосферу. Но ты ведь человека не столько зарплатой должен удерживать, сколько интересными задачами, которые впоследствии в каком-то смысле изменят мир. Вероятно, это одна из причин, почему нам удавалось удержать инициативных людей - мы давали им возможность реализовывать свои идеи. - С продажами сложности во время кризиса были? - Российские продажи упали вдвое, а западные хоть уже были (на западные рынки мы вышли в 1997 году), но еще не настолько велики, чтобы давать прибыль. Выручка имелась, но много денег уходило на местный офис, локальный маркетинг. Мы пришли к сотрудникам и сказали: у компании нет богатого дяденьки, все, что зарабатываем, - на ладони. Поэтому наше предложение: а) мы не будет увольнять сотрудников, как это делают в других компаниях, и б) не будем снижать зарплату вдвое, как во многих других компаниях. Мы хотим сохранить всю зарплату, но не можем физически ее выплатить, поэтому предлагаем получать половину, а вторую половину откладывать на депозит, и на эти деньги будут начисляться годовые проценты. Компания обязуется когда-нибудь эти депозиты выплатить. И никто не уволился. Хотя возможность сменить работу имелась. Ведь у всех сотрудников был высокий профессиональный уровень. У нас всегда проводились вступительные экзамены в компанию: всем кандидатам предлагалось шесть задачек, сейчас, по-моему, десять. В основном на ясность ума, сообразительность и логическое мышление. - Типа как перевезти через реку волка, козу и капусту? - Что-то вроде этого. Неограниченное время, только нельзя пользоваться телефоном. Садись и решай, хоть весь день. Решают все, включая пиарщиков, менеджеров и инженеров. Зачем? В какой-то момент мне стало понятно: чтобы стать хорошим продавцом, надо быть умным человеком. Это я прочитал в одной американской книжке - 10 качеств хорошего продавца. Среди них есть и знание продукта, и лидерские качества, и ум. Но именно ум - это качество № 1, а лидерские качества - это качество № 2. - С депозитами не обманули? - Мы их выплатили. По-моему, в 2002 году или 2001-м. Всем. Плюс шесть процентов в год, которые к этой сумме добавились. Это еще один момент, когда мы поняли, что лояльность команды дорогого стоит. - До каких финансовых показателей доросли? - Их можно оценить: 14 офисов, 1250 штатных сотрудников и 900 внештатников, свыше 30 миллионов пользователей в более чем 150 странах мира. - Как в наукоемком бизнесе появился ресторан ArteFAQ, в котором мы сидим? - Я еще в 1998 году передал управление компанией ABBYY и начал несколько совсем новых проектов, включая Cybiko - карманный коммуникатор для молодежи. Можно ввести информацию о себе: возраст, рост, вес, цвет глаз, какое учебное заведение окончил, что читаешь, какую музыку слушаешь и т. д., и о девушке своей мечты. А коммуникатор начнет вибрировать, если найдет девушку с таким устройством и совпадающим профилем на расстоянии 150 метров. Тогда еще не было интерфейса BlueTooth, да и мобильных телефонов у молодых людей тоже. Только-только ICQ появилась. И когда в компании Cybiko мы создали такое устройство, оно пошло на ура. В Америке в 2000 году мы продали четверть миллиона экземпляров. Это был большой проект, очень веселый. Нас узнавали на улице, о нас писала пресса. Правда, случился интернет-кризис, а на следующий год - теракт во Всемирном торговом центре, и нам пришлось компанию продать. Но многие называют Cybiko первой попыткой соцсети в мире. Я вернулся в Россию, где-то полгодика ничем не занимался, просто отдыхал, отсыпался. Потом, так уж случилось, занялся своим давнишним хобби - театральным акционизмом. Я занимался перформансами в качестве организатора, сценариста, участника еще на физтехе, мне это нравилось. Вместе с Татьяной Халевиной мы поставили хеппенинг под названием «Коммуникативный проект «Шесть чувств» - это было в 2003 году, по-моему. И тут появляется такая штука - флешмоб, которая комбинирует все: и коммуникации, и культурные явления, и технологии. Конечно, я этим загорелся. Мы создали сайт fmob.ru, который организовал более 50 флешмобов, включая глобальные, в 130 странах. - Какие акции были? Хулиганские или высоколобокультурные? - Ох, всякие были. Это ведь целая субкультура. От чисто развлекательных мобов, как, например, «Толкаем дом» - в Столешниковом переулке собралось 250 человек, которые решили сдвинуть дом. И до очень тонких флешмобов типа «Обострение нюха»: люди пришли в парфюмерный магазин «Арбат Престиж» в «Атриуме», а девиантность их поведения заключалась в том, что в отличие от обычных людей, которые нюхают пробники, наши участники нюхали ценники. Это вызвало удивительную реакцию - руководство магазина вызвало милицию, но все успели разойтись до ее приезда. И до очень сложных концептуальных мобов, малодевиантных, например «Звон ключами»: люди должны были собраться в одном месте и по команде зазвенеть ключами в кармане. Ты не видишь реальных участников, еле слышишь позвякивание в карманах - сам процесс моба, но не видишь его. На волне этой субкультуры в 2004 году появилось FAQ-Cafe' (от стандартной для IТ-индустрии аббревиатуры FAQ - часто задаваемые вопросы. - «Итоги»). Потом вот этот ArteFAQ, где мы сейчас сидим. Потом DeFAQto, «Сквот», «Сестры Гримм». Но это хобби. Я благодаря этим хобби получил сертификацию бармена. Из непрофессиональных своих дел единственное, что интересно отметить, - в последний год я занялся вопросами правильного питания и написал книжку «Теперь я ем все, что хочу!». - Для кого вы ее писали? - Я писал ее для няни и бабушек, чтобы они правильно кормили детей. Но она оказалась популярной, вышел уже второй тираж. Это не бизнес-проект, весь гонорар я передаю в одну детскую больницу. После того как я за полгода прочитал кипу научных статей про питание, включая рекомендации ВОЗ, я понял, насколько люди не представляют, что они едят, и не понимают, в какой сильной зависимости они находятся от четырех продуктов - соли, сахара, насыщенного жира и продукции из муки высокого помола, главным образом хлеба и мучных изделий. Но книжка на самом деле не об этом. Она посвящена тому, как изменить свои пищевые привычки. - Во главе компании стоят бессменные лидеры. Это принципиальная позиция? - Нужен баланс преемственности и сменяемости. Компания должна быть генератором и инкубатором талантов. Мы активно работаем над тем, чтобы превратить некоторые подразделения в стартапы с целью того, чтобы позже выкупить обратно. - Не заскучали, когда на смену юношескому задору пришла рутинная работа по поддержке крупного бизнеса? - Высокотехнологичный бизнес - это не просто механизм, который нужно только смазывать и следить за уровнем топлива. Каждые несколько лет компания претерпевает трансформации в связи с региональным ростом, с появлением новых или исчезновением старых вертикалей бизнеса. У нас матричная структура управления: есть продуктовое направление, скажем, FineReader, Lingvo, Data Capture, SDK, мобильные продукты. Есть региональное деление. И нет единственно правильного ответа на вопрос, как это должно быть устроено. Иногда компании устроены феодальным образом: есть локальный начальник, и под ним - все: своя юридическая структура, свой HR, свой маркетинг, своя структура продаж, своя разработка. Он дает свой результат, но компания в целом не может обмениваться общими наработками. Обратная ситуация - когда в Москве находится главный разработчик и все трудятся по его указке. Это тоже может быть неправильной структурой, потому что один человек не может учесть все региональные реалии. Все очень специфично. У нас в Европе сильный розничный канал, а в Америке в основном корпоративный канал. Поэтому мы пытаемся понять, как, с одной стороны, сохранить структуру, а с другой - создавать анклавы стартаперских возможностей и простых решений. А стартапы - это всегда непредсказуемая история. - Над чем сейчас работают ваши ученые? - Compreno - это система понимания, анализа и перевода текстов на естественных языках, которая помогает компьютеру понять окружающий мир через тексты на естественных языках. Возможно, что через несколько лет люди будут общаться с телевизорами, холодильниками, пылесосами на естественном языке. В российских подразделениях ABBYY сейчас работает более 700 разработчиков, и 300 человек из этих 700 занимаются семантическим проектом Compreno. Чтобы обеспечить развитие проекта, мы создали три кафедры - две в Физтехе и в РГГУ, связанные с прикладной лингвистикой и распознаванием образов. В целом Compreno - это 18 лет научных разработок и сотни разработчиков, вовлеченных в этот проект сейчас. Мы уверены, что проекты, связанные с настоящей семантикой, станут центральными в IТ-сфере в ближайшие пять лет |