Prompt

Attach MediaLibrary
Pick Character
1 / 4
💎 2 tokens
Demo Preview

Ernie Image

ERNIE-Image

ERNIE-Image는 읽기 쉬운 텍스트, 강력한 프롬프트 충실도, 포스터, 인포그래픽 및 만화를 위한 구조화된 레이아웃이 필요한 창작자를 위해 Baidu의 오픈 웨이트 텍스트-이미지 모델입니다.
텍스트 중심 및 구조화된 AI 이미지 출력을 보여주는 ERNIE-Image 히어로 비주얼

ERNIE-Image의 주요 기능

읽기 쉬운 포스터 텍스트와 깔끔한 시각적 계층 구조를 보여주는 ERNIE-Image 예제
짧은 프롬프트를 구조화된 이미지 브리프로 확장하는 ERNIE-Image 워크플로우 비주얼
패널과 조직화된 텍스트 블록이 포함된 구조화된 생성 예제를 보여주는 ERNIE-Image
창작자 하드웨어에서 로컬 오픈 웨이트 평가를 나타내는 배포 지향 비주얼

ERNIE-Image의 핵심 신호

8B DiT 기반

Baidu는 ERNIE-Image를 모호한 이름 없는 스택이 아닌 8B 단일 스트림 DiT 모델로 공개합니다.

프롬프트 강화 경로

짧은 프롬프트는 생성 전에 확장될 수 있으며, 이는 장면이 명확하지만 문구가 부족한 경우에 유용합니다.

텍스트 중심 강점

공식 자료는 스타일화된 아트에 국한되지 않고 긴 형식 및 레이아웃에 민감한 텍스트를 강조합니다.

터보 옵션

ERNIE-Image-Turbo는 더 빠른 반복과 가벼운 검토 루프를 위한 8단계 변형으로 문서화되어 있습니다.

24G VRAM 목표

Baidu는 모델이 24G VRAM을 가진 소비자 GPU에서 실행될 수 있다고 말하며, 이는 로컬 테스트 계획에 중요합니다.

벤치마크 투명성

GenEval 및 LongTextBench 표가 공개되었지만, 이는 테스트를 안내하는 데 사용되어야 하며 이를 대체해서는 안 됩니다.

ERNIE-Image 평가 방법

세 가지 실용적인 단계
01

출력 유형으로 시작

실제 작업을 먼저 명명하세요: 포스터, 인포그래픽, 만화 패널, UI와 같은 장면 또는 사실적인 구성. ERNIE-Image는 구조와 텍스트가 중요한 경우 가장 흥미롭습니다.

02

텍스트와 레이아웃을 초기 단계에서 지정

레이블 요구 사항, 계층 구조 및 객체 관계를 프롬프트 상단에 배치하여 스타일 언어를 미세 조정하기 전에 모델이 어려운 제약 조건을 해결하도록 하세요.

03

표준과 터보 비교

같은 프롬프트 팩을 ERNIE-Image와 ERNIE-Image-Turbo를 통해 실행한 다음 충실도, 속도 및 검토 노력의 균형에 가장 잘 맞는 버전을 유지하세요.

팀이 ERNIE-Image를 주목하는 이유

어려운 프롬프트에 더 적합

시각적 브리프에 레이블, 패널 또는 구조화된 정보가 포함된 경우 ERNIE-Image는 주로 스타일 샘플을 기반으로 판매되는 모델보다 더 쉽게 정당화할 수 있습니다.

오픈 웨이트 평가 경로

이는 배포를 간단하게 만들지는 않지만 모호한 엔터프라이즈 전용 이미지 제공보다 더 구체적인 출발점을 제공합니다.

출판된 데이터, 단순한 슬로건이 아님

실제 신뢰 신호는 ERNIE-Image가 모든 것을 이긴다고 주장하는 것이 아니라, 공식 자료가 모델이 실제로 강한 곳을 검증할 수 있을 만큼 충분한 구체적인 내용을 제공한다는 것입니다.
자주 묻는 질문

ERNIE-Image에 대한 일반적인 질문

OCMaker AI에서 ERNIE-Image 워크플로우 시도하기
텍스트에서 이미지로 열기