|
2 | 2 |
|
3 | 3 | ## Что за проект
|
4 | 4 |
|
5 |
| -Команда `Unity` в `Rambler&Co`. Мы занимаемся разработкой продуктов, обеспечивающих работу редакций интернет-изданий - таких как [ferra.ru](https://www.ferra.ru/), [secretmag.ru](https://secretmag.ru/) и др. |
| 5 | +Команда `Unity` в `Rambler&Co`. |
6 | 6 |
|
7 |
| -Сайты разрабатываются отдельно группой фронтенда. На бэкенде есть набор сервисов, ключевые это: |
| 7 | +Мы занимаемся разработкой продуктов, обеспечивающих работу редакций интернет-изданий - таких как [ferra.ru](https://www.ferra.ru/), [secretmag.ru](https://secretmag.ru/) и др. |
| 8 | + |
| 9 | +Сайты разрабатываются отдельно группой фронтенда. На бэкенде есть набор приложений и сервисов, ключевые это: |
8 | 10 |
|
9 | 11 | ### krang
|
10 | 12 |
|
11 |
| -`CMS` на `postgres`, админка в которой работают редакции. |
| 13 | +`CMS` на `postgres`, админка в которой работают редакции (фронт разрабатывается отдельной командой). |
12 | 14 |
|
13 | 15 | ### bebop
|
14 | 16 |
|
|
22 | 24 |
|
23 | 25 | ### krang
|
24 | 26 |
|
25 |
| -Некоторые операции, такие как создание топика и др. могут занимать существенное время. Наверное, в рамках ДЗ мы попытаемся сконцентрировться на этом приложении. |
| 27 | +Некоторые операции, такие как создание топика и др., могут занимать существенное время. |
| 28 | + |
| 29 | +В рамках ДЗ мы попытаемся сконцентрировться на этом приложении. |
26 | 30 |
|
27 | 31 | ### bebop
|
28 | 32 |
|
29 | 33 | Думаю, часть апи практически никогда не играет роль боттлнека по времени. Как обсуждалось на лекциях, сайты СМИ как правило тяжеловесны, и на их фоне выдача подготовленных данных из `mongoDB` не будет играть существенной роли.
|
30 | 34 |
|
31 | 35 | ## Есть ли мониторинг
|
32 | 36 |
|
33 |
| -`New Relic` (подключен `krang`, `bebop` - планируется), `Kibana` с дашбордами и наверное, что-то еще чего пока не видел. |
| 37 | +- `New Relic` (подключен `krang`, `bebop` - планируется); |
| 38 | +- `Kibana` с дашбордами; |
| 39 | +- что-то еще, чего пока не видел. |
34 | 40 |
|
35 | 41 | ## Можете ли вы навскидку предположить где в проекте есть что оптимизировать
|
36 | 42 |
|
37 |
| -Когда получил доступ в `NewRelic` заметил на распухающее время `Redis zscan` за последнее 3 месяца - абсолютный лидер в числе тяжеловесных операций в данный момент, задача в работе. |
| 43 | +Когда получил доступ в `NewRelic` обратил внимание на распухающее время `Redis zscan`, за последнее 3 месяца - это абсолютный лидер среди тяжеловесных операций. Задача в работе. |
38 | 44 |
|
39 | 45 | ## Какова ваша роль в проекте, как давно работаете, чем занимаетесь
|
40 | 46 |
|
41 |
| -Инженер-разработчик группы бэкенд, в компании 1.5 года. Занимаюсь разработкой приложений/сервисов на `Ruby`, вкл. написание тестов, исправление багов и пр. |
| 47 | +Инженер-разработчик `Ruby` группы бэкенд, в компании 1.5 года. Занимаюсь разработкой приложений/сервисов на `Ruby`, вкл. написание тестов, исправление багов и пр. |
42 | 48 |
|
43 | 49 | # Оптимизация Redis zscan
|
44 | 50 |
|
|
50 | 56 |
|
51 | 57 | <img src="/screenshots/top_20_db_operations_before.png" width="200" />
|
52 | 58 |
|
53 |
| -Абсолютно большая часть нагрузки обусловлена выполнением `Sidekiq/Social::CountUpdaterJob`: |
| 59 | +Абсолютно большая часть нагрузки приходится на джобу `Sidekiq/Social::CountUpdaterJob`: |
54 | 60 |
|
55 | 61 | <img src="/screenshots/redis_zscan_time_consumption_by_caller.png" width="200" />
|
56 | 62 |
|
|
60 | 66 |
|
61 | 67 | Задача данной джобы заключается в сборе данных о репостах из социальных сетей (в нашем случае `vk` и до недавнего времени - `facebook`).
|
62 | 68 |
|
63 |
| -Наличие `redis zscan` в джобе обусловлено тем, что при постановке джобы мы ищем дубликаты по объектам - с целью минимизации общего кол-ва запросов. Требование связано с действющим на текущий момент ограничением `не более 1 запроса в 20 секунд`. |
| 69 | +Наличие `redis zscan` в джобе обусловлено тем, что при постановке джобы мы ищем дубликаты по объектам - с целью минимизации общего кол-ва запросов: требование связано с действующим на текущий момент ограничением `не более 1 запроса в 20 секунд`. |
64 | 70 |
|
65 |
| -Так в связи с подключением новых проектов база за последние 3 месяца выросла, пропорциональным образом (`O(N)`) возросло и время ее ответа. |
| 71 | +В связи с подключением новых проектов, база за последние 3 месяца выросла - пропорциональным образом (`O(N)`) возросло и время ответа `redis zscan`. |
| 72 | + |
| 73 | +Главной целью стал поиск путей отказа от проверки дублирования и как следствие - использования `redis zscan`. |
66 | 74 |
|
67 | 75 | Первая мысль была в том, чтобы найти ручку `vk`, которая собирает данные по многим топикам сразу, пакетно: возможно, с момента нашего последнего обновления такая возможность появилась, но такая ручка не нашлась.
|
68 | 76 |
|
|
89 | 97 | <img src="/screenshots/redis.png" width="200" />
|
90 | 98 |
|
91 | 99 | Мы планируем еще понаблюдать за ситуацией, и после финализации решения установим защитный алерт для защиты метрики.
|
| 100 | + |
| 101 | +# Профит |
| 102 | + |
| 103 | +Ориентировочный срок окупаемости - 3 месяца. |
| 104 | + |
| 105 | +```ruby |
| 106 | +# стоимость разработчика |
| 107 | +dev_cost_rub_month = 4_000 * 100 |
| 108 | +=> 400000 # (руб/месяц) |
| 109 | +dev_cost_rub_day = dev_cost_rub_month / 20 |
| 110 | +=> 20000 # (руб/день) |
| 111 | + |
| 112 | +# стоимоть требуемого увеличения мощностей (руб) |
| 113 | +# NOTE. сейчас redis работает на двух инстансах, |
| 114 | +# таким образом, для увеличения мощностей пропорционально возросшей нагрузки, |
| 115 | +# нам нужно 2 дополнительных сервера |
| 116 | +server_cost_rub_month = 3_000 |
| 117 | +=> 3000 |
| 118 | +redis_cost_rub_month = server_cost_rub_month * 2 |
| 119 | +=> 6000 |
| 120 | + |
| 121 | +# стоимость оптимизации (руб) |
| 122 | +task_cost_rub = dev_cost_rub_day * 1 |
| 123 | +=> 20000 |
| 124 | + |
| 125 | +# срок окупаемости (месяц) |
| 126 | +time_to_profit_month = task_cost_rub / redis_cost_rub_month |
| 127 | +=> 3 |
| 128 | +``` |
| 129 | + |
| 130 | +Без учета того, что: |
| 131 | +- общая нагрузка на `redis`, по сравнению с показателями 3-месячной давности, спала примерно в 2.5 раза; |
| 132 | +- ввод дополнительного сервера не защитил бы нас от возможного возвращения проблемы в будущем; |
| 133 | +- не только `CountUpdaterJob`, но и другие операции, использующие `redis`, стали выполняться быстрее. |
0 commit comments