Week 2 #127

AlexeyRyabchikov · 2025-02-28T12:40:35Z

No description provided.

spajic

Approve, nice work, хорошо, что использовали фидбек от 1го ДЗ и хорошо, что поделали итераций до переделывания на потоковую работу 👍

spajic · 2025-03-02T21:26:12Z

case-study.md

+
+## Формирование метрики
+Для того, чтобы понимать, дают ли мои изменения положительный эффект на быстродействие программы я придумал использовать такую метрику: программа не должна потреблять больше **70Мб** памяти при обработке файла `data_large.txt` в течение всей своей работы.
+(Учел ошибку первой домашней работы и сделал объем данных больше, для того чтобы проблемы были более очевидны на частичных файлах от основного)


spajic · 2025-03-02T21:26:29Z

case-study.md

+Программа поставлялась с тестом. Выполнение этого теста в фидбек-лупе позволяет не допустить изменения логики программы при оптимизации.
+
+## Feedback-Loop
+Для того, чтобы иметь возможность быстро проверять гипотезы я выстроил эффективный `feedback-loop`, который позволил мне получать обратную связь по эффективности сделанных изменений за 15-20 секунд.


spajic · 2025-03-02T21:27:33Z

case-study.md

+   Строка 103:
+   user_sessions = sessions.select { |session| session['user_id'] == user['id'] }
+```
+- Как и в первой домашней работе заменил перебор всех сессий на хэш с группированные данных по user_id. В данном конкретном месте алгоритмическая сложность с O(n) изменилась на O(1).


spajic · 2025-03-02T21:29:29Z

case-study.md

+
+   Строка 139:
+   collect_stats_from_users(report, users_objects) do |user|
+     { 'dates' => user.sessions.map{|s| s['date']}.map {|d| Date.parse(d)}.sort.reverse.map { |d| d.iso8601 } }


строка кстати избыточно плотная, тут и map 3 раза, ещё sort, ещё reverse, ещё Date.parse,...

для более понятных отчётов в таких случаях можно просто отформатировать на несколько строчек это

spajic · 2025-03-02T21:30:24Z

case-study.md

+
+## Результаты
+В результате проделанной оптимизации наконец удалось обработать файл с данными.
+Удалось улучшить метрику системы с 131 MB при выполнении 20_000к строк и 226 MB при выполнении 40_000к строк в начале, до ~38 мБ на файле `data_large.txt` и уложиться в заданный бюджет.


spajic · 2025-03-02T21:31:12Z

task-2.rb

-    @sessions = sessions
-  end
+def parse_line(line)
+  type, id, *params = line.split(',')


что-то я подозреваю, что *params может подтормаживать по сравнению с явным указанием переменных (не критично, просто заметка)

aleksey.ryabchikov added 5 commits February 26, 2025 12:50

loop_1

a97bcda

loop_2

29afa0e

loop_3

edd51ee

loop_4

438799d

last_loop

1baf3d6

AlexeyRyabchikov force-pushed the week_2 branch from ad2f3be to 1baf3d6 Compare February 28, 2025 12:45

spajic approved these changes Mar 2, 2025

View reviewed changes

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Week 2 #127

Week 2 #127

AlexeyRyabchikov commented Feb 28, 2025

spajic left a comment

spajic Mar 2, 2025

spajic Mar 2, 2025

spajic Mar 2, 2025

spajic Mar 2, 2025

spajic Mar 2, 2025

spajic Mar 2, 2025

spajic Mar 2, 2025

Week 2 #127

Are you sure you want to change the base?

Week 2 #127

Conversation

AlexeyRyabchikov commented Feb 28, 2025

spajic left a comment

Choose a reason for hiding this comment

spajic Mar 2, 2025

Choose a reason for hiding this comment

spajic Mar 2, 2025

Choose a reason for hiding this comment

spajic Mar 2, 2025

Choose a reason for hiding this comment

spajic Mar 2, 2025

Choose a reason for hiding this comment

spajic Mar 2, 2025

Choose a reason for hiding this comment

spajic Mar 2, 2025

Choose a reason for hiding this comment

spajic Mar 2, 2025

Choose a reason for hiding this comment