Apache Spark в YTsaurus
Александр Токарев > Тимлид команды разработки SPYT / YTsaurus (Яндекс)
В докладе расскажу о том, как мы интегрировали Spark в YTsaurus. Расскажу про основные этапы интеграции, такие как поддержка формата хранения данных YTsaurus, оптимизации для работы с сортированными таблицами, интеграция с планировщиком YTsaurus. Также расскажу про то, для чего нам изначально потребовалось сделать форк Spark и как мы в итоге от форка отказались. В заключении расскажу про состоянии интеграции Spark с YTsaurus на сегодняшний день и про перспективы развития этого проекта.