본문 바로가기
Mid journey/Mid Journey 소식

미드저니(Midjourney) v6 출시, 개선점 및 총정리

by DesignerAllan 2024. 1. 9.
반응형

안녕하세요 Allan입니다.

 

이번 포스팅에서는 2023/12/21에 출시된 미드저니 v6에 대해 다뤄보도록 하겠습니다.

 

국내에서 가장 많이 사용되고 있는 이미지 생성형 AI인 미드저니의 대규모 업데이트인 만큼 상세하게 알아보도록 하겠습니다.

 

1. 미드저니 v6의 개선된 기능

먼저, 미드저니 v6가 도입되면서 개선된 부분들 대해서 알아보겠습니다.

1. Much more accurate prompt following as well as longer prompts

2. Improved coherence, and model knowledge
3. Improved image prompting and remix
4. Minor text drawing ability (you must write your text in "quotations" and  --style raw or lower --stylize values may help)
   /imagine a photo of the text "Hello World!" written with a marker on a sticky note --ar 16:9 --v 6 
5. Improved upscalers, with both 'subtle' and 'creative' modes (increases resolution by 2x)
(you'll see buttons for these under your images after clicking U1/U2/U3/U4)

 

1. 프롬프트 이해 능력 향상 및 긴 프롬프트 이해

2. 향상된 일관성 및 모델 지식

3. 이미지 프롬프트 및 리믹스 개선

4. 이미지 내 텍스트 삽입 기능 (텍스트를 따옴표 " "안에 작성해야 하며 --style raw 혹은 낮은 styleize 값에서 효과적입니다.)

5. 'subtle'과 'creative' 업스케일러 추가. 해상도는 2배 증가합니다. 

 

2. 미드저니 v6 프롬프트 작성 방법

이전 미드저니 버전 까지는 4k나 hyperreal 등의 품질과 관련된 프롬프트를 많이 포함하여 프롬프트를 작성하였습니다.

 

하지만 v6 부터는 이러한 품질 관련된 프롬프트를 사용하지 않는 것이 좋다고 합니다.

V6 is MUCH more sensitive to your prompt. Avoid 'junk' like "award winning, photorealistic, 4k, 8k

 

미드저니 v6를 사용하실 때는 품질 관련된 의미없는 프롬프트를 작성하지 말고 원하는 이미지를 명확하게 표현하는 것이 중요합니다.

 

style raw를 활용하거나 낮은 stylize 값을 사용하면 원하는 바를 더 정확하게  구현할 수 있다고 합니다.

 

 

 

3. 미드저니 v6 실전 이미지 생성

 

3-1 프롬프트 이해 능력 테스트

미드저니의 프롬프트 이해 능력은 다른 생성형 AI 툴들에 비해서 뛰어난 편이기는 하나, 그렇다고 사용자가 작성한 프롬프트를 완벽하게 이해할 수 있지는 않았습니다.

 

하지만 v6 업데이트를 통해서 미드저니의 프롬프트 이해 능력이 대폭 향상되었다고 합니다.

 

v5와의 비교를 통해서 어느 정도 향상되었는지 테스트해보도록 하겠습니다.

 

red octopus reading the newspaper sit on a toilet, white lights, white tones, white wall, mirror behind, led lights, glow lights, hyper-realistic, photo realistic, cinematic lighting, highly detailed --ar 2:3 

v5
v왼쪽 v5, 오른쪽 v6

 

위 그림 중 왼쪽이 v5로 생성한 이미지, 오른쪽이 v6로 생성한 이미지입니다.

 

보시는 것처럼 v5로 생성한 이미지는 프롬프트의 일부(white tones, white wall, mirror behind)를 구현하지 못한 반면 v6로 생성한 이미지는 프롬프트를 그대로 구현한 것을 확인할 수 있습니다.

 

사실 이전 버전인 v5까지는 이렇게 긴 프롬프트를 입력하면 프롬프트를 온전하게 인식하지 못하는 경우가 대부분이였기 때문에 프롬프트를 길게 쓰는 것이 오히려 원하는 이미지 생성에 악영향을 끼쳤습니다.

 

하지만 프롬프트 이해 능력이 향상된 v6에서는 어느정도 긴 프롬프트를 사용할 수 있게 될 것 같습니다.

 

 

3-2 Upscale(Subtle)과 Upscale(Creative)

추가적으로 Upscale(Subtle)과 Upscale(Creative) 모드가 추가되었으니 사용해 보시면 좋을 것 같습니다.

 

이 이미지 기준으로는 크게 차이가 있지는 않습니다.

 

 

3-3 텍스트 삽입 기능

 a photo of the text "Hello World!" written with a marker on a sticky note --ar 16:9 --v 6

텍스트 삽입

 

이렇게 이미지 내에 자연스럽게 텍스트를 렌더링 할 수 있는 기능이 추가되었습니다.

 

참고로 말씀드리면 한글 삽입은 아직 많이 부족합니다.

 

 

 

반응형