Prompt
Ernie Image
ERNIE-Image

ERNIE-Image의 주요 기능
읽기 쉬운 텍스트 레이아웃
Baidu는 ERNIE-Image를 밀도 높은 긴 형식 및 레이아웃에 민감한 텍스트에 적합하도록 명시적으로 위치시킵니다. 이는 레이블이 깨지거나 왜곡된 복사본이 초안을 망칠 수 있는 포스터, 인포그래픽 및 UI와 같은 시각적 요소에 더 적합합니다.

프롬프트 강화 지원
ERNIE-Image는 DiT 모델과 경량 프롬프트 강화기를 결합하여 짧은 프롬프트를 풍부한 설명으로 확장합니다. 이는 창작자가 장면 유형을 알고 있지만 생성 전에 모델이 더 많은 구조를 추가하기를 원하는 경우에 가장 유용합니다.

구조화된 장면 제어
공식 문서는 포스터, 만화, 스토리보드 및 다중 패널 구성에 대해 반복적으로 언급합니다. 이러한 사용 사례는 레이아웃이 단순히 나중에 추가된 장식이 아니라 의미의 일부이기 때문에 중요합니다.

오픈 웨이트 배포 적합성
Baidu는 ERNIE-Image가 24G VRAM을 가진 소비자 GPU에서 실행될 수 있다고 말하며, 이는 호스팅된 이미지 API에만 의존하지 않고 로컬에서 오픈 웨이트 모델을 평가하려는 팀에게 실용적인 기준입니다.

ERNIE-Image의 핵심 신호
8B DiT 기반
프롬프트 강화 경로
텍스트 중심 강점
터보 옵션
24G VRAM 목표
벤치마크 투명성
ERNIE-Image 평가 방법
출력 유형으로 시작
실제 작업을 먼저 명명하세요: 포스터, 인포그래픽, 만화 패널, UI와 같은 장면 또는 사실적인 구성. ERNIE-Image는 구조와 텍스트가 중요한 경우 가장 흥미롭습니다.
텍스트와 레이아웃을 초기 단계에서 지정
레이블 요구 사항, 계층 구조 및 객체 관계를 프롬프트 상단에 배치하여 스타일 언어를 미세 조정하기 전에 모델이 어려운 제약 조건을 해결하도록 하세요.
표준과 터보 비교
같은 프롬프트 팩을 ERNIE-Image와 ERNIE-Image-Turbo를 통해 실행한 다음 충실도, 속도 및 검토 노력의 균형에 가장 잘 맞는 버전을 유지하세요.
팀이 ERNIE-Image를 주목하는 이유
- 어려운 프롬프트에 더 적합: 텍스트 중심 및 레이아웃에 민감한 장면은 ERNIE-Image가 가장 명확하게 출판된 스토리를 가지고 있는 곳입니다.
- 오픈 웨이트 평가 경로: 24G VRAM 지침은 로컬 테스트 및 내부 도구를 위한 모델 접근성을 높입니다.
- 출판된 데이터, 단순한 슬로건이 아님: Baidu는 출시된 변형 및 벤치마크 표를 공유하며, 이는 여전히 자체 프롬프트 테스트가 필요하더라도 유용합니다.



