-
Notifications
You must be signed in to change notification settings - Fork 115
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Optimization task3 #123
base: master
Are you sure you want to change the base?
Optimization task3 #123
Changes from all commits
File filter
Filter by extension
Conversations
Jump to
Diff view
Diff view
There are no files selected for viewing
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -0,0 +1 @@ | ||
--require spec_helper |
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -0,0 +1,4 @@ | ||
class BusesService < ApplicationRecord | ||
belongs_to :bus | ||
belongs_to :service | ||
end |
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -0,0 +1,53 @@ | ||
# frozen_string_literal: true | ||
|
||
class TripsImporter | ||
attr_reader :file_name | ||
|
||
def initialize(file_name) | ||
@file_name = file_name | ||
end | ||
|
||
def call | ||
json = JSON.parse(File.read(file_name)) | ||
|
||
ActiveRecord::Base.transaction do | ||
City.delete_all | ||
Bus.delete_all | ||
Service.delete_all | ||
Trip.delete_all | ||
ActiveRecord::Base.connection.execute('delete from buses_services;') | ||
|
||
cities = {} | ||
buses = {} | ||
services = {} | ||
buses_services = {} | ||
trips = [] | ||
|
||
json.each do |trip| | ||
cities[trip['from']] ||= City.new(name: trip['from']) | ||
cities[trip['to']] ||= City.new(name: trip['to']) | ||
bus = buses[trip['bus']['number']] ||= Bus.new(number: trip['bus']['number'], model: trip['bus']['model']) | ||
|
||
trip['bus']['services'].each do |service| | ||
bus_service = services[service] ||= Service.new(name: service) | ||
buses_services[[bus, bus_service]] ||= BusesService.new(bus: bus, service: bus_service) | ||
end | ||
|
||
trips << Trip.new( | ||
from: cities[trip['from']], | ||
to: cities[trip['to']], | ||
bus: buses[trip['bus']['number']], | ||
start_time: trip['start_time'], | ||
duration_minutes: trip['duration_minutes'], | ||
price_cents: trip['price_cents'] | ||
) | ||
end | ||
|
||
City.import!(cities.values) | ||
Bus.import!(buses.values) | ||
Service.import!(services.values) | ||
BusesService.import!(buses_services.values) | ||
Trip.import!(trips) | ||
end | ||
end | ||
end |
This file was deleted.
This file was deleted.
This file was deleted.
This file was deleted.
Original file line number | Diff line number | Diff line change |
---|---|---|
|
@@ -7,10 +7,20 @@ | |
|
||
<% @trips.each do |trip| %> | ||
<ul> | ||
<%= render "trip", trip: trip %> | ||
<% if trip.bus.services.present? %> | ||
<%= render "services", services: trip.bus.services %> | ||
<li><%= "Отправление: #{trip.start_time}" %></li> | ||
<li><%= "Прибытие: #{(Time.parse(trip.start_time) + trip.duration_minutes.minutes).strftime('%H:%M')}" %></li> | ||
<li><%= "В пути: #{trip.duration_minutes / 60}ч. #{trip.duration_minutes % 60}мин." %></li> | ||
<li><%= "Цена: #{trip.price_cents / 100}р. #{trip.price_cents % 100}коп." %></li> | ||
<li><%= "Автобус: #{trip.bus.model} №#{trip.bus.number}" %></li> | ||
<% services = trip.bus.services %> | ||
<% if services.present? %> | ||
<li>Сервисы в автобусе:</li> | ||
<ul> | ||
<% services.each do |service| %> | ||
<li><%= "#{service.name}" %></li> | ||
<% end %> | ||
</ul> | ||
<% end %> | ||
</ul> | ||
<%= render "delimiter" %> | ||
==================================================== | ||
There was a problem hiding this comment. Choose a reason for hiding this commentThe reason will be displayed to describe this comment to others. Learn more. Just for your info: https://guides.rubyonrails.org/layouts_and_rendering.html#spacer-templates |
||
<% end %> |
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -0,0 +1,52 @@ | ||
# Case-study оптимизации | ||
|
||
## Актуальная проблема | ||
1. Файл с данными `large.json` (100K трипов) загружается больше 12 минут. В то время как бюджет на загрузку <= 1 минуты. | ||
2. Страница с данными загружается за ~17 секунд. Видно, что выполняется очень много запросов к БД. | ||
|
||
## Формирование метрики | ||
Для файла `small.json` данные загружаются за 12.00s и 154MB | ||
Для файла `medium.json` данные загружаются за 81.85s и 197MB | ||
Для файла `large.json` данные загружаются за 735.55s и 391MB | ||
|
||
Я буду проверять время загрузки сначала для 1K, потом 10K, 100K трипов. | ||
|
||
## Гарантия корректности работы оптимизированной программы | ||
Я вынесла логику из таски в сервисе TripsImporter и написала rspec тест. | ||
|
||
|
||
## Проблема 1 | ||
Долгий иморт | ||
Переписала TripsImporter с использованием Activerecord-Import, время загрузки изменилось | ||
для файла `small.json` данные загружаются за 1.69s | ||
для файла `medium.json` данные загружаются за 4.1s | ||
для файла `large.json` данные загружаются за 13.8s | ||
There was a problem hiding this comment. Choose a reason for hiding this commentThe reason will be displayed to describe this comment to others. Learn more. 👍 |
||
|
||
## Проблема 2 | ||
Долгая загрузка страницы | ||
rack-mini-profiler показывает, что страница грузится минимум 17s | ||
`Rendering: trips/index.html.erb 9023.1 +30.4 1012 sql 1318.8` | ||
- Добавляю gem bullet. Он показывает, что надо добавить в запрос `.includes[:bus]` и `.includes[:services]` После добавления includes время загрузки уменьшилось до 9s, и больше нет 1000+ запросов sql из одного места. Осталось 7 запросов. | ||
|
||
- Убрала паршалы из вью, загрузка сократилась до 6-7s | ||
|
||
## Проблема 3 | ||
Долгая загрузка страницы. Изучаю страницу при помощи pghero. | ||
Вкладка Overview показывает No long running queries. Не предлагает никаких индексов. | ||
На вкладке Queries: | ||
22% времени тратится на запрос `SELECT "trips".* FROM "trips" WHERE "trips"."from_id" = $1 AND "trips"."to_id" = $2 ORDER BY "trips"."start_time" ASC` | ||
Предлагается | ||
`CREATE INDEX CONCURRENTLY ON trips (from_id, to_id)` | ||
И 18% на `SELECT COUNT(*) FROM "trips" WHERE "trips"."from_id" = $1 AND "trips"."to_id" = $2` | ||
There was a problem hiding this comment. Choose a reason for hiding this commentThe reason will be displayed to describe this comment to others. Learn more. count запрос вообще не нужен, так как мы грузим данные и можем просто взять size |
||
Предлагается то же самое. | ||
Добавляю индексы. | ||
После добавления индексов процент снизился до 17% и 14% соответственно, скорость загрузки сократилась до 5837ms | ||
There was a problem hiding this comment. Choose a reason for hiding this commentThe reason will be displayed to describe this comment to others. Learn more. скорость загрузки -> время загрузки (сорри за душноту 😁) |
||
|
||
Так же pghero предлагает добавить индекс `CREATE INDEX CONCURRENTLY ON buses_services (bus_id)` | ||
Хотя запрос `SELECT "buses_services".* FROM "buses_services" WHERE ....` занимает 3% | ||
There was a problem hiding this comment. Choose a reason for hiding this commentThe reason will be displayed to describe this comment to others. Learn more. да, на время рендеренга нашей страницы это почти не повлияет; но если мы занимались оптимизацией именно нагрузки на БД, то там бы это имело смысл |
||
|
||
## Проблема 4 | ||
rack-mini-profiler показывает что запросы на buses, buses_services и services выполняются отдельно. | ||
Предполагаю что надо заменить в контроллере includes на eager_load, чтобы избавиться от этого. Теперь вместо 7 запросов - 4 и страница загружается за 1439ms | ||
|
||
Менее 1,5 секунд уже приемлемое время, а что еще оптимизировать я с имеющимися инструментами не обнаружила. | ||
There was a problem hiding this comment. Choose a reason for hiding this commentThe reason will be displayed to describe this comment to others. Learn more. 👍 ✅ |
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -1,4 +1,6 @@ | ||
Rails.application.routes.draw do | ||
# For details on the DSL available within this file, see http://guides.rubyonrails.org/routing.html | ||
get "автобусы/:from/:to" => "trips#index" | ||
|
||
mount PgHero::Engine, at: "pghero" | ||
end |
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -0,0 +1,15 @@ | ||
class CreatePgheroQueryStats < ActiveRecord::Migration[8.0] | ||
def change | ||
create_table :pghero_query_stats do |t| | ||
t.text :database | ||
t.text :user | ||
t.text :query | ||
t.integer :query_hash, limit: 8 | ||
t.float :total_time | ||
t.integer :calls, limit: 8 | ||
t.timestamp :captured_at | ||
end | ||
|
||
add_index :pghero_query_stats, [:database, :captured_at] | ||
end | ||
end |
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -0,0 +1,13 @@ | ||
class CreatePgheroSpaceStats < ActiveRecord::Migration[8.0] | ||
def change | ||
create_table :pghero_space_stats do |t| | ||
t.text :database | ||
t.text :schema | ||
t.text :relation | ||
t.integer :size, limit: 8 | ||
t.timestamp :captured_at | ||
end | ||
|
||
add_index :pghero_space_stats, [:database, :captured_at] | ||
end | ||
end |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
лайк за отдельный класс