이 페이지는 M2 와 공유하는 public product catalog를 기준으로, 특정 상품을 광고 지면에 노출시키기 위한 배너 카피와 배너 asset을 얼마나 빠르고 일관되게 생성하는지 시험한다. 자유 입력 화면이 아니라 시험용 공유 catalog 와 controlled preset을 기준으로, 작은 GPT 모델이 실제 live generation을 수행하는 화면이다. 연구개발 목표치는 상품 100개 동시 처리 기준 최종 750×750 이미지를 만들면서 총 성공 이미지 생성 속도 100개/분 초과이며, Stress preset이 이 목표 검증 시나리오다.
M2 와 공유하는 public product catalog 3/9/100 상품 subset을 기준으로 상품별 배너 생성 품질을 측정한다. 모든 preset은 작은 GPT 모델로 live generation을 수행하고, 생성 성공률, 정책 위반 수, 다양성, 평균 생성시간을 함께 본다. 또한 Stress preset에서는 상품 100개를 동시에 처리했을 때 최종 750×750 이미지를 기준으로 총 성공 이미지 100개/분 초과 목표를 충족하는지 본다.
products_with_successful_image_count와 images_per_minute를 계산해 연구개발 목표(Stress: 100개 상품 모두 성공 이미지 확보 + 총 성공 이미지 100개/분 초과)를 검증한다.대표 기준은 generation_success_rate가 충분히 높고, policy_violation_count = 0에 가깝고, diversity가 기준 이상이며, average_generation_time_ms가 허용 범위 내인 것이다. 여기에 Stress preset에서는 product_count >= 100, products_with_successful_image_count = product_count, images_per_minute > 100도 동시에 만족해야 PASS다.
상단 결과 pane에서 즉시 PASS / FAIL과 주요 지표를 볼 수 있다. 최근 runs 표의 product 수 / successful products / images per minute / gen_success 컬럼으로 비교하고, view csv / download csv / variations json / assets zip / report 링크와 SVG preview에서 상품별 배너 샘플을 확인하면 된다.
| run_id | preset | status | pass | products | successful_products | images/min | gen_success | image_model | avg_ms | preview | artifacts |
|---|