본문 바로가기
Like AI/Chat-GPT

[챗GPT 플러스] 그림 그리기 기능 - DALL-E 3 기본 설정 및 상세 파라미터 조정 (이미지 사이즈, 갯수, Seed가 아닌 ID 요청)

by skyfishb 2023. 12. 3.

 

오늘은 챗GPT에 탑재된이미지 생성 도구, DALL-E 3에 대해 조금 더 상세하게 . DALL-E 3는 상상력을 현실로 만드는 강력한 도구로, 사용자의 지시에 따라 다양한 이미지를 창조합니다. DALL-E 3의 기본 설정과 조정 가능한 설정 파라미터, 그리고 그 사용 방법에 대해 상세히 소개하고자 합니다.

 

그리고 23.11 업그레이드 달리에서는 Seed가 아닌 ID가 생겼네요! 중요한 변경점 ! 고고 

 

1. 챗GPT의 DALL-E 3 기본 설정 파라미터 조건 (23.12 기준)  


1) 이미지 크기 (size)

DALL-E 3는 세 가지 크기의 이미지를 생성할 수 있습니다: 

  • 1024x1024(정사각형)
  • 1792x1024(가로 긴 사각형)
  • 1024x1792(세로 긴 사각형)

2) 생성 이미지 수 (count)

기본적으로 한 번의 요청에 하나의 이미지를 생성합니다.

 

4) 이제는 시드 (Seed)가 아닌  Generation ID 로 생성이미지 만들기 

생성 AI를 조금만 해봤다면 연속적인 스타일의 이미지 생성을 위해 시드(Seed)의 중요성을 알고있습니다. 여전히 시드번호를 물어보면 알려주기는 하지만, 이제 gpt4의 달리에서는 generation Id로 연속적인 이미지를 만들수 있습니다.

 

Q. 이미지의 id와 seed는 다른거야?

네, 이미지의 ID와 seed는 서로 다른 것입니다. 각각의 용도는 다음과 같습니다:

이미지 ID (Generation ID): 이것은 DALL-E가 생성한 특정 이미지를 식별하는 고유한 식별자입니다. 이미지 ID를 사용하여 특정 이미지를 참조하거나, 해당 이미지에 대한 후속 요청을 할 수 있습니다.

Seed: Seed는 이미지 생성 과정에서 사용되는 랜덤 숫자입니다. 이 숫자는 생성된 이미지의 특정한 특성을 결정하는데 사용됩니다.

예를 들어, 동일한 이미지 요청에 대해 다른 seed 값을 사용하면, 비슷하지만 약간 다른 결과의 이미지가 생성됩니다. Seed는 이미지의 다양성을 생성하고, 동일한 요청에 대해 여러 다른 결과를 탐색할 수 있게 해줍니다. 간단히 말해, 이미지 ID는 특정 이미지를 식별하고 참조하는 데 사용되며, seed는 이미지 생성 과정에서의 무작위성을 제어하는 데 사용됩니다.

(예시)
1. 기본이미지를 생성한다. Generation ID를 물어본다.
2. Generation ID 를 활용해서 새로운 이미지를 만든다
3. 원본이미지와 똑같은 프롬프트를 사용하고  "아무것도 변경하지 마세요",  “don’t change anything” 라고 한다. 
4. 이렇게 하면 약간의 변경 점(숫자 노이즈, 아날로그 그레인/노이즈의 디지털 등가물)이 있을 수 있지만 이전 이미지의 정확한 사본이 생성됩니다.
5. generation id 의 뒤에 랜덤하게 32개 char 를 넣으면 유사한데 다르게 됩니다

*Generation ID는 채팅방 내에서만 존재하고 다른 채팅방끼리는 호환이 안됩니다. 

 

참고: 집요한 개발자들의 논쟁- -https://community.openai.com/t/the-new-dall-e-uses-seeds-without-seeds/470350/36

 

2. 조정 가능한 설정 파라미터 및 사용 방법

1) 이미지 크기 조정 예시

예시: "1024x1024 크기로 화려한 정원을 그려주세요."
사용 방법: 이미지 요청 시 원하는 크기를 명시적으로 지정합니다.

 

2) 생성할 이미지 수 조정

현재는 한 번에 하나의 이미지만 요청할 수 있습니다.
사용 방법: 여러 이미지가 필요한 경우, 각각 별도의 요청을 합니다.

 

*하나의 이미지안에 여러 개의 서브 이미지 생성하는 방법

 

4) 참조(reference) 이미지 사용

예시: 이전에 생성된 이미지의 ID를 이용해 비슷한 스타일의 이미지 요청.
사용 방법: 참조하고자 하는 이미지의 ID를 요청에 포함시킵니다.

refer f0GbRJCowSvZOgvT


DALL-E 3는 이러한 다양한 설정을 통해 사용자의 창의력을 자극하고, 상상 속 이미지를 현실로 만들어 줍니다.

 

Open AI Forum 에 정리된 전략은 이렇습니다.

Applying This to Image Creation and Iteration Strategy: 이미지 생성 및 반복 전략

  1. Subtle Prompt Modifications (프롬프트 미묘한 수정): When you want to create variations of an existing image with minimal differences, make only slight alterations to the prompt. Keep these changes specific and focused, such as adding or changing a single object or action within the scene. 최소한의 차이로 기존 이미지의 변형을 만들려면 프롬프트를 약간만 변경하세요. 장면 내에서 하나의 객체나 동작을 추가하거나 변경하는 등 이러한 변경 사항을 구체적이고 집중적으로 유지하세요.
  2. Using Closely Related Gen_IDs ( 관계성 높은 Gen_ID 사용 ): Start with Gen_IDs from images that are already similar or have minor differences. This approach ensures that the base of your new creation is closely aligned with your desired outcome, limiting the AI’s scope for introducing significant changes. 이미 유사하거나 약간의 차이가 있는 이미지의 Gen_ID로 시작하세요. 이 접근 방식은 새 창작물의 기반이 원하는 결과물과 밀접하게 일치하도록 하여 AI가 큰 변화를 도입할 수 있는 범위를 제한합니다.
  3. Consistent Style and Composition ( 일관된 스타일과 구도 ): If the original image and the new image prompts share a similar style and composition (like the ‘Ligne claire’ style in your example), the AI is more likely to produce closely related outcomes, even with different Gen_IDs.원본 이미지와 새 이미지 프롬프트가 비슷한 스타일과 구성을 공유하는 경우(예시의 'Ligne claire' 스타일처럼), AI는 Gen_ID가 다르더라도 밀접하게 관련된 결과를 생성할 가능성이 더 높습니다

 

챗GPT에 탑재된 DALL-E 3의 기본 및 조정 가능한 설정 파라미터에 대해 알아보았습니다. 

모두들 즐거운 생성 AI 시대되세요

 

by. skyfishb

댓글