松泉, 바라보기, 인생글, 좋은글, 취미생활

유용, ComfyUI, LTX-2.3 스타일 전환에 대해서 알려줘

Songchoen 송천 2026. 4. 17. 20:05
728x90
반응형

 

 

# Trigger Word
zhuanchang

If needed, place the trigger word near the end of the prompt so the base prompt still clearly describes:
- subject
- scene
- camera movement
- transformation behavior
- atmosphere

 

 


# Prompting Guide
For best results, prompts should usually contain:
1. Shot description
   Example: close-up, medium shot, wide shot, low-angle, tracking shot.
2. Subject and environment
   Describe the character, object, or scene as clearly as possible.
3. Motion or transformation process
   Explain what changes over time: identity, style, object form, scene layout, or camera trajectory.
4. Visual details
   Add texture, lighting, color, material, and spatial cues.
5. Ending trigger
   Add zhuanchang when you want the LoRA behavior to activate more strongly.

 

 

 


## LTX-2 Prompting Tips

1. **Core Actions**: Describe events and actions as they occur over time  
2. **Visual Details**: Describe all visual details you want to appear in the video  
3. **Audio**: Describe sounds and dialogue needed for the scene

## Report LTX-2 Issues
To report any issues when running this workflow, [go to GitHub](https://github.com/Lightricks/ComfyUI-LTXVideo/issues)

## Model Links (for Local Users)

**checkpoints**

- [ltx-2.3-22b-distilled-fp8.safetensors](https://huggingface.co/Lightricks/LTX-2.3-fp8/resolve/main/ltx-2.3-22b-distilled-fp8.safetensors)

**text_encoders**

- [gemma_3_12B_it_fp4_mixed.safetensors](https://huggingface.co/Comfy-Org/ltx-2/resolve/main/split_files/text_encoders/gemma_3_12B_it_fp4_mixed.safetensors)

**loras**

- [ltx2.3-transition.safetensors](https://huggingface.co/valiantcat/LTX-2.3-Transition-LORA/resolve/main/ltx2.3-transition.safetensors)


## Model Storage Location

```
📂 ComfyUI/
├── 📂 models/
│   ├── 📂 checkpoints/
│   │   └── ltx-2.3-22b-distilled-fp8.safetensors
│   ├── 📂 text_encoders/
│   │   └── gemma_3_12B_it_fp4_mixed.safetensors
│   └── 📂 loras/
│       └── ltx2.3-transition.safetensors
```

 

 

 

 

LTX-2.3은 Lightricks에서 2026년 초에 발표한 최신 비디오 생성 모델로, 이전 버전에 비해 스타일 전환(Style Transfer & Transition) 및 제어 능력이 비약적으로 상승했습니다.

 

스타일 전환을 구현하는 핵심 방법 4가지를 정리해 드립니다.


1. Video-to-Video 스타일 변환 (Redesign)

기존 비디오의 구도는 유지하면서 화풍만 바꾸는 기능입니다. LTX-2.3에서는 VAE(변분 오토인코더)가 재설계되어, 원본의 디테일을 뭉개지 않고도 정교하게 스타일을 입힐 수 있습니다.

 

  • 작동 방식: 입력 비디오와 함께 새로운 스타일 프롬프트를 입력하면, 캐릭터의 움직임은 유지한 채 '사이버펑크', '유화', '3D 애니메이션' 등으로 스타일을 완전히 바꿉니다.
  • 장점: LTX-2.3 특유의 4배 커진 텍스트 커넥터 덕분에 "1950년대 누아르 영화 스타일" 같은 복잡한 스타일 지시어도 정확하게 반영됩니다.

 

2. 스타일 전용 LoRA 활용

LTX-2.3은 최대 3개의 LoRA(미세 조정 모델)를 동시에 중첩해서 사용할 수 있습니다.

 

  • 스타일 고정: 특정 작가의 화풍이나 웹툰 스타일로 학습된 LoRA를 적용하여 일관된 출력을 얻습니다.
  • 커스텀 스타일: LTX-2.3-Transition-LORA 같은 전용 모델을 사용하면, 비디오 중간에 A 스타일에서 B 스타일로 자연스럽게 변하는 스타일 모핑(Morphing) 효과를 줄 수 있습니다.

 

3. LTX Studio의 'Style Elements' 기능

플랫폼 기반(LTX Studio)으로 사용하신다면 가장 직관적인 방법입니다.

 

  • Elements 저장: 마음에 드는 비디오나 이미지에서 스타일만 추출해 'Element'로 저장할 수 있습니다.
  • 즉시 전환: 복잡한 프롬프트 없이 저장해둔 스타일 카드를 선택하는 것만으로 프로젝트 전체의 톤앤매너를 순식간에 교체할 수 있어 작업 효율이 매우 높습니다.

 

4. Image-to-Video를 통한 스타일 가이드

사용자님이 직접 제작하신 디지털 아트(Digital Noir나 Tenebrism 스타일 등)를 **첫 프레임(First Frame)**으로 넣고 비디오를 생성하는 방식입니다.

 

  • 일관성 유지: LTX-2.3은 입력 이미지의 조명, 질감, 색감을 끝까지 유지하는 능력이 강력해졌습니다.
  • 팁: 이미지의 '고대비' 특성을 프롬프트에 명시하면 모델이 그 스타일을 비디오 전체의 물리 엔진에 반영하여 더욱 입체감 있는 결과물을 만듭니다.

 

💡 사용자님을 위한 하드웨어 팁

사용 중이신 **RTX A4500(20GB VRAM)**은 LTX-2.3 기본 모델(약 24GB~32GB 권장)을 돌리기에 약간 타이트할 수 있습니다. 다음 설정을 권장합니다:

  • PolarQuant Q5 버전 사용: 최근 공개된 5비트 양자화 모델을 사용하면 품질 저하 거의 없이 VRAM 사용량을 16~18GB 수준으로 낮춰 로컬에서도 쾌적하게 스타일 전환 작업을 하실 수 있습니다.
  • ComfyUI 워크플로우: LTX-2.3-Multifunctional 노드를 사용하면 스타일 전환, 립싱크, 업스케일링을 하나의 워크플로우에서 관리할 수 있어 편리합니다.

현재 구상 중인 특정 아트 스타일(예: 디지털 누아르)을 비디오로 구현하고 싶으신가요? 상황에 맞는 더 구체적인 프롬프트 작성법이 필요하시면 말씀해 주세요!

 

자동화 First, Last 폴더를 2개 만들었다. 자동으로 하나씩 들어가도록 한다.

반응형