BTL_CV

Data

Chúng tôi thực nghiệm với bộ Nature Image trên Kaggle. Dữ liệu bao gồm 6899 ảnh thuộc 8 lớp khác nhau bao gồm:

airplane: ảnh máy bay, gồm 727 ảnh.
car: ảnh các loại xe, gồm 968 ảnh.
cat: ảnh mèo, gồm 885 ảnh.
dog: ảnh chó, gồm 702 ảnh.
flower: ảnh hoa, gồm 843 ảnh.
fruit: ảnh hoa quả, gồm 1000 ảnh.
motorbike: ảnh xe máy, gồm 788 ảnh.
person: ảnh người, gồm 986 ảnh

Ví dụ mẫu:

Download Bạn có thể download trực tiếp trên Kaggle hoặc trực tiếp từ drive của chúng tôi tại đây.
Chúng tôi có tìm kiếm thêm một số data cho các nhãn chó, mèo và flower bạn có thể download tại đây.

Set up

Cài đặt môi trường

Cài đặt môi trường anaconda theo hướng dẫn tại đây
Sau khi cài đặt tạo môi trường mới:

conda create -n name_env python==3.6.9
conda activate name_env

Cài đặt các package và thư viện liên quan

pip install -r requirements.txt

Use command line interface

Huấn luyện models

chỉnh sửa các siêu tham số trong file config tương tứng
run command line:

python run_cli.py --mode=train --config_path=configs/natural_image_config.json

Mô tả các tham số truyền:

mode=train để lựa chọn mode huấn luyện model.
config_path: đường dẫn tới file config.

Đánh giá models

run command line:

python run_cli.py --mode=eval --config_path=configs/natural_image_config.json

python run_cli.py --mode=eval \ 
--serialization_dir=models/Local_Bov_His_Hog \
--test_path=data/natural_images/test_names.csv

Bạn có thể đánh giá model trực tiếp với folder lưu model sau khi huấn luyện. Hoặc có thể đánh gía model từ file config với các tham số truyền như sau:

mode=eval lựa chọn mode đánh giá model
config_path: đường dẫn tới file config. Được sử dụng khi muốn đánh giá model từ file config
serialization_dir: đường dẫn tới folder lưu model.
test_path: folder chứa tập ảnh test. Hoặc file chứa đường dẫn của các ảnh trong tập test.

Dự đoán

python run_cli.py --mode=infer \
--config_path=configs/natural_image_config.json \
--image_path='data/natural_images/car/car_0000.jpg' \
--imshow=True

python run_cli.py --mode=infer \
--serialization_dir=models/Local_Bov_His_Hog \
--image_path='data/natural_images/car/car_0000.jpg' \
--imshow=True

Dự đoán phân loại của model lựa chọn.

mode=infer lựa chọn mode dự đoán
config_path: đường dẫn tới file config. Model sẽ được load với đường dẫn trong file config.
serialization_dir: đường dẫn tới folder lưu model.
image_path: đường dẫn tới ảnh muốn dự đoán
imshow: có show hình ảnh dự đoán hay không. Muốn tắt ảnh ấn một phím bất kỳ

Một số model chúng tôi đã train vào lưu tại đây, bạn có thể tải về và dải nén để có thể thử nghiệm.

Mô tả các tham số trong file config:

{
  "label2idx": {
        "airplane": 0,
        "car": 1,
        "cat": 2,
        "dog": 3,
        "flower": 4,
        "fruit": 5,
        "motorbike": 6,
        "person": 7
    },
  "extractor_name": "Feature2D.SIFT",
  "model_name": "MLPClassifier",
  "model_args": {},
  "image_size": [150, 150],
  "image_grid": [5, 5],
  "use_local_bov": false,
  "use_local_feature": true,
  "n_visuals": 400,
  "bov_path": "bov/bov_400.sav",
  "serialization_dir": "models/Local_Bov_His_Hog",
  "train_path": "data/natural_images/train_names.csv",
  "test_path": "data/natural_images/test_names.csv",
  "data_path": null,
  "result_path": "results/use_local_feature",
  "use_extend_image": false,
  "extend_image_dir": "data/extend",
  "use_global_feature": true,
  "global_names": ["histogram", "hog"],
  "hog_size": [128, 128]
}

label2idx: dict chuyển label thành index
extractor_name: tên của bộ trích xuất đặc trưng: hiện tại hỗ trợ 2 bộ là "Feature2D.SIFT" và "Feature2D.ORB"
model_name: model class name
image_size: kích thước của image khi đọc
image_grid: kích thước của grid khi trích xuất đặc trưng cục bộ
n_visuals: số lượng từ trọng visuals vocab bằng số cụm khi phân phân cụm
bov_path: đường dẫn tới model bov (model phân cụm)
serialization_dir: folder lưu model và config
train_path: đường dẫn tới data train, có thể là thư mục chứa hình ảnh, hoặc file chứ các đường dần của tập train
test_path: đường dẫn tới data test, có thể là thư mục chứa hình ảnh, hoặc file chứ các đường dần của tập test
data_path: đường dẫn tới data, nếu như tập data chưa được chia train và test
result_path: đường dẫn tới thư mục lưu kết quả đánh giá
use_extend_image: có sử dụng thêm ảnh bên ngoài để huấn luyện hay không
extend_image_dir: folder chứ tập ảnh thêm vào để khi huấn luyện
use_global_feature: có sử dụng global feature hay không
global_names: tên các global feature sử dựng, hiện tại chỉ hỗ trỡ "histogram" và "hog"
hog_size: kích thước ảnh khi sử dụng để trích xuất đặc trưng hog.

Build bov model

python buil_bov.py --config_path=configs/bov_config.json

Mô tả các tham số trong file config bag of visual:

{
  "image_size": [150, 150],
  "extractor_name": "Feature2D.SIFT",
  "n_visuals": 100,
  "bov_dir": "models/bov",
  "data_path": "data/natural_images/train_names.csv",
  "extend_image_dir": "data/extend",
  "use_extend_image": true
}

image_size: kích thước của image khi đọc
extractor_name: tên của bộ trích xuất đặc trưng: hiện tại hỗ trợ 2 bộ là "Feature2D.SIFT" và "Feature2D.ORB"
n_visuals: số lượng từ trọng visuals vocab bằng số cụm khi phân phân cụm
data_path: đường dẫn tới data chứa ảnh để trích xuất các descriptor
use_extend_image: có sử dụng thêm ảnh bên ngoài để huấn luyện hay không
extend_image_dir: folder chứ tập ảnh thêm vào để khi huấn luyện

Name		Name	Last commit message	Last commit date
Latest commit History 32 Commits
configs		configs
data		data
docs		docs
results		results
src		src
.gitignore		.gitignore
README.md		README.md
buil_bov.py		buil_bov.py
feature_extraction.py		feature_extraction.py
preprocessing.py		preprocessing.py
requirements.txt		requirements.txt
run_cli.py		run_cli.py
train.py		train.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

BTL_CV

Data

Set up

Cài đặt môi trường

Use command line interface

Huấn luyện models

Đánh giá models

Dự đoán

Mô tả các tham số trong file config:

Build bov model

Mô tả các tham số trong file config bag of visual:

About

Releases 1

Packages

Contributors 3

Languages

tungnkhust/Image-Classification-With-Bag-of-Visual-Model

Folders and files

Latest commit

History

Repository files navigation

BTL_CV

Data

Set up

Cài đặt môi trường

Use command line interface

Huấn luyện models

Đánh giá models

Dự đoán

Mô tả các tham số trong file config:

Build bov model

Mô tả các tham số trong file config bag of visual:

About

Resources

Stars

Watchers

Forks

Releases 1

Packages 0

Contributors 3

Languages

Packages