Optimize task 1 #152

iris-the-fox · 2025-01-27T14:37:18Z

No description provided.

spajic

Nice work!

spajic · 2025-01-28T21:19:32Z

assert_performance_spec.rb

+  before do
+    `head -n #{8000} data_large.txt > data_small.txt`
+  end
+  it 'works under 1 ms' do


spajic · 2025-01-28T21:19:52Z

assert_performance_spec.rb

+
+  let(:measurement_time_seconds) { 1 }
+  let(:warmup_seconds) { 0.2 }
+  it 'works faster than 1 ips' do


spajic · 2025-01-28T21:21:41Z

assert_performance_spec.rb

+    }.to perform_at_least(1).within(measurement_time_seconds).warmup(warmup_seconds).ips
+  end
+
+  it 'works with data_large under 35sec' do


для реального теста конечно слишком много; сейчас пришла идея, что в принципе можно даже закомитить что-то подобное в рабочую репу, но добавить например ENV-переменную вроде PERF_TEST

и запускать такие тесты только если ENV[PERF_TEST] == 'true'

spajic · 2025-01-28T21:24:25Z

case-study.md

+Я решил исправить эту проблему, оптимизировав эту программу.
+
+## Формирование метрики
+Для того, чтобы понимать, дают ли мои изменения положительный эффект на быстродействие программы я придумал использовать такую метрику: Файл размером 3250940 строк должен обрабатываться за 30 секунд.


Это не совсем метрика, это финальный бюджет скорее

Этот вопрос в данном случае tricky. По факту нет простого одного ответа на всю работу. У нас на каждую итерацию оптимизации новая метрика - время работы на файлах разного размера. Когда мы не можем посчитать общую метрику на всю систему / исходную проблему, то мы можем воспользоваться промежуточными метриками. Их функция получается в том, чтобы помочь нам понять, была ли оптимизация успешна на данной итерации.

spajic · 2025-01-28T21:27:12Z

case-study.md

+### Ваша находка №1
+- Все отчеты показали главную точку роста Array#select (59.64% по ruby-prof flat)
+- Вместо перебора сессий в select создала массив sessins_hash c ключом user_id
+- На 16000 строк ips увеличился с  0.236 до 2.581


главное, что асимптотику поправили

spajic · 2025-01-28T21:27:39Z

case-study.md

+
+### Ваша находка №3
+- callstack отчет показывает точку роста в collect_stats_from_users, а конкретно в Date#parse
+- Я решила сделать сортировку даты без парсинга


👍 да-да, это пасхалочка

spajic · 2025-01-28T21:28:53Z

case-study.md

+- Проблема все еще имеет высокий процент, но он снизился до (8.84%)
+
+На этом моменте я решила использовать для бенчмаркинга и профилирования большие величины, чтобы увеличить точность.
+На 128_000 строк ips  - 0.867i/s


ips лучше подходит для микро-бенчмарков, где много итераций в секунду

у нас тут скорее ситуация, когда надо много секунд на одну итерацию, поэтому проще в секундах считать

spajic · 2025-01-28T21:29:41Z

case-study.md

+
+### Ваша находка №7
+- ruby-prof flat показывает точку роста в Array#map
+- Несколько раз вызываются лишние map, убрала их. Так же заменила метод поиска уникальных браузеров на Set


spajic · 2025-01-28T21:32:17Z

case-study.md

+
+## Результаты
+В результате проделанной оптимизации наконец удалось обработать файл с данными.
+Удалось улучшить метрику системы с до 33.65 что почти укладывается в заданный бюджет.


это конечно от компа зависит; в целом вроде у вас основное всё сделано чего обычно хватает для победы

есть шанс что во втором задании при подходе к этой проблеме с другой стороны получиться уложиться в 30 сек!

iris-the-fox added 10 commits January 26, 2025 11:08

benchmark

cf46dce

optimize Array#select

9421d00

optimize uniqBrowsers

a133512

optimize Date#parse

f758572

optimize Array#+

2fdb832

optimize String#split

04157e2

optimize collect_stats_from_users

6288d40

fixes

3e0b622

optimize Array#map

87d4790

last optimization

2a98c68

spajic approved these changes Jan 28, 2025

View reviewed changes

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Optimize task 1 #152

Optimize task 1 #152

iris-the-fox commented Jan 27, 2025

spajic left a comment

spajic Jan 28, 2025

spajic Jan 28, 2025

spajic Jan 28, 2025

spajic Jan 28, 2025

spajic Jan 28, 2025

spajic Jan 28, 2025

spajic Jan 28, 2025

spajic Jan 28, 2025

spajic Jan 28, 2025

Optimize task 1 #152

Are you sure you want to change the base?

Optimize task 1 #152

Conversation

iris-the-fox commented Jan 27, 2025

spajic left a comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment