M6 — 상품 카테고리 분류 정확도 (5-fold CV)

M6 — 상품 카테고리 분류 정확도 시험 안내

본 시험은 자유 입력 데모가 아니라, Bright Data Amazon products 실수집 artifact를 바탕으로 classical ML(Multinomial Naive Bayes) 분류기의 5-fold stratified 교차검증 정확도를 측정·판정하는 화면이다. Run preset 은 실제 10,000개 상품으로 실행된다. 핵심 평가는 회차별 정확도, 평균 정확도, 표준편차이며 연구개발 목표치는 cv_mean_accuracy >= 0.90 및 cv_std_accuracy <= 0.10이다.

1. 시험 목적

상품 feature fixture를 대상으로 상품 카테고리 분류 정확도를 측정한다. 분류기는 Multinomial Naive Bayes를 사용하며, 회차별 accuracy와 교차검증 평균 정확도 및 표준편차를 산출한다.

2. 입력 조건

입력 데이터셋은 Bright Data Amazon products 실수집 CSV에서 materialize한 generated products.csv이며, preset의 controlled option으로 product_set, model, feature_field, fold_count, seed를 고정한다. 허용 규모는 P10000이고 허용 모델은 MultinomialNB, fold 수는 5이다.

Bright Data 기반 fixture(products.csv) 확인

3. 실행 절차

Run을 누른다.
Run의 controlled option과 함께 Bright Data Amazon products 실수집 기반 generated 상품 카테고리 fixture를 로드한다.
상품 데이터를 5개 stratified fold로 분할하고, 각 회차마다 4개 fold로 학습(train)한 뒤 1개 fold로 검증(validation)한다.
회차별 accuracy, 평균 정확도(cv_mean_accuracy), 표준편차(cv_std_accuracy)를 계산한다.

4. 측정값 / 5. 판정 기준

주요 측정값은 cv_sample_count, cv_class_count, cv_fold_accuracies, cv_mean_accuracy, cv_std_accuracy이다. 판정은 cv_mean_accuracy >= 0.90 및 cv_std_accuracy <= 0.10을 동시에 만족해야 PASS로 본다.

6. 산출물 확인

실행 후 결과 pane의 정확도 요약 카드에서 회차별 정확도를 즉시 확인하고, 최근 runs 표에서는 특히 CV mean acc와 CV std를 비교한다. cv folds csv, predictions json, report html/pdf로 상세 산출물을 확인할 수 있다.

모든 시험은 자유 입력 대신 Run 기준의 controlled input으로만 실행된다. 따라서 같은 Run을 다시 실행하면 같은 조건에서 결과를 비교할 수 있다.

M6 — 상품 카테고리 분류 정확도 (5-fold CV)

M6 — 상품 카테고리 분류 정확도 시험 안내

1. 시험 목적

2. 입력 조건

3. 실행 절차

4. 측정값 / 5. 판정 기준

6. 산출물 확인

실행 결과 요약

최근 runs