Yogorang Research Pipeline Dashboard

A/B Test - Fast Track vs Hard Track

검색 쿼리를 입력하거나 Golden Set에서 선택하여 두 검색 전략을 비교합니다.

검색 대상:

기본 컬렉션 사용 (yogorang_fast_track, yogorang_hard_track)

예시:

▶ Dimension 패턴 설정 기본 패턴 사용중

01_extract_zero_db.py

대기중

Zero DB (Cloud SQL)에서 테이블을 선택하여 로컬 PostgreSQL에 동기화

Zero DB (CloudSQL) 테이블 선택

--truncate (로컬 테이블 데이터 삭제 후 저장)

준비 중... 0%

↓

01b_create_sampled_table.py

선택적

소스 테이블에서 Golden Set 포함 샘플링하여 새 테이블 생성 (선택적 단계)

소스 테이블:

타겟 Prefix: yogorang_ _refinements

Golden Set:

목표 샘플 수:

--recreate (기존 테이블 삭제 후 재생성)

준비 중... 0%

↓

⚙

Domain Settings

기본값

Steps 05-12에서 사용할 데이터 소스와 평가 데이터셋을 설정합니다.

Refinements 테이블:

Golden Set 파일:

↓

05_load_refinements_to_qdrant.py

대기중

Fast Track - Refinements를 Qdrant에 적재 → yogorang_{DATA_PREFIX}_fast_track

Mode:

준비 중... 0%

↓

06_eval_fast_track.py

대기중

Fast Track 평가 - Golden Set 기반 검색 성능 측정 (Hit@K, MRR, NDCG)

Mode:

Alpha Config (Dimension별 Hybrid 가중치): 0 = Sparse(BM25), 1 = Dense(Voyage)

Feature: Context: Sentiment: Relation: Dirty:

준비 중... 0%

↓

07_score_and_tier.py

대기중

Refinements 품질 점수 계산 + 티어 할당 → yogorang_{DATA_PREFIX}_scored 저장

Mode:

--use-vision (이미지 품질 분석, 느림)

--stats (통계만 표시)

준비 중... 0%

↓

08_extract_t1_dna.py

대기중

Tier 1 (Top 10%) 상품에서 4-DNA 추출 (Gemini LLM)

Mode:

준비 중... 0%

↓

09_create_ontology.py

대기중

DNA 클러스터링으로 Ontology v1.0 자동 생성 (UMAP + HDBSCAN, 파라미터 자동 설정)

Mode:

UMAP/HDBSCAN 파라미터는 데이터 크기에 따라 자동 설정됩니다 (--dataset-scale auto)

준비 중... 0%

10_extract_remain_dna_and_update_ontology.py

대기중

Tier 2/3/4 상품 DNA 추출 + Ontology 업데이트 (threshold 0.7 자동 적용)

Mode:

Tier 2/3/4 전체 처리, Similarity Threshold 0.7 자동 적용

준비 중... 0%

↓

11_load_dna_and_ontology_to_qdrant.py

대기중

Hard Track - DNA + Ontology를 Qdrant에 적재 → yogorang_{DATA_PREFIX}_hard_track

Mode:

--purge (기존 컬렉션 삭제 후 재생성)

준비 중... 0%

↓

12_eval_hard_track.py

대기중

Hard Track 평가 - DNA 파이프라인 후 검색 성능 측정 (Fast Track 비교 가능)

Mode:

골든셋 JSON 선택:

Alpha Config (Dimension별 Hybrid 가중치): 0 = Sparse(BM25), 1 = Dense(Voyage)

Feature: Context: Sentiment: Relation: Dirty:

--compare (Fast Track 결과와 비교)

준비 중... 0%

총 0건

데이터 소스를 선택하고 조회 버튼을 클릭하세요.

1 / 1

A/B Test - Fast Track vs Hard Track

01_extract_zero_db.py

01b_create_sampled_table.py

Domain Settings

05_load_refinements_to_qdrant.py

06_eval_fast_track.py

07_score_and_tier.py

08_extract_t1_dna.py

09_create_ontology.py

10_extract_remain_dna_and_update_ontology.py

11_load_dna_and_ontology_to_qdrant.py

12_eval_hard_track.py

리포트

Column Name

Run Hard Track Pipeline