M3 — 상품 기반 배너 자동생성

M3 — 상품 기반 배너 자동생성 시험 안내

이 페이지는 M2 와 공유하는 public product catalog를 기준으로, 특정 상품을 광고 지면에 노출시키기 위한 배너 카피와 배너 asset을 얼마나 빠르고 일관되게 생성하는지 시험한다. 자유 입력 화면이 아니라 시험용 공유 catalog 와 controlled preset을 기준으로, 작은 GPT 모델이 실제 live generation을 수행하는 화면이다. 연구개발 목표치는 상품 100개 동시 처리 기준 OpenAI native square image를 후처리 리사이즈 없이 생성하면서 총 성공 이미지 생성 속도 100개/분 초과이며, Run preset이 이 목표 검증 시나리오다.

무엇을 테스트하나요?

M2 와 공유하는 public product catalog 100개 동시 처리 검증 세트를 기준으로 상품별 배너 생성 품질을 측정한다. preset은 작은 GPT 모델로 live generation을 수행하고, 생성 성공률, 정책 위반 수, 다양성, 평균 생성시간을 함께 본다. 또한 Run preset에서는 상품 100개를 동시에 처리했을 때 OpenAI native square image를 후처리 리사이즈 없이 생성하고 총 성공 이미지 100개/분 초과 목표를 충족하는지 본다.

어떻게 진행되나요?

Run을 누른다.
Run에 묶인 M2 공유 상품 catalog(100개 동시 처리 세트)과 output format / style / safety 옵션을 불러온다.
작은 GPT 모델이 상품명·브랜드·설명·태그·용도·스펙·pain point 를 읽고 상품별 배너 카피를 live generation 한다.
OpenAI gpt-image-1 image API가 native square 이미지를 생성하고, 후처리 리사이즈 없이 성공/실패 및 재시도 결과를 기록한다.
동시에 products_with_successful_image_count와 images_per_minute를 계산해 연구개발 목표(Run: 100개 상품 모두 성공 이미지 확보 + 총 성공 이미지 100개/분 초과)를 검증한다.

어떤 결과가 나와야 하나요?

대표 기준은 generation_success_rate가 충분히 높고, policy_violation_count = 0에 가깝고, diversity가 기준 이상이며, average_generation_time_ms가 허용 범위 내인 것이다. 여기에 Run preset에서는 product_count >= 100, products_with_successful_image_count = product_count, images_per_minute > 100도 동시에 만족해야 PASS다.

실행 후 어디를 보면 되나요?

상단 결과 pane에서 즉시 PASS / FAIL과 주요 지표를 볼 수 있다. 최근 runs 표의 product 수 / successful products / images per minute / gen_success 컬럼으로 비교하고, view csv / download csv / variations json / assets zip / report 링크와 SVG preview에서 상품별 배너 샘플을 확인하면 된다.

모든 시험은 자유 입력 대신 preset 기반의 controlled input으로만 실행된다. canonical input 은 M2 와 공유하는 public product catalog 이며, 연구개발 목표치 검증은 Run preset 기준으로 본다.

M3 — 상품 기반 배너 자동생성