Files
animily_music/docs/PET_MUSIC_SCIENCE.md
javamon 37d13be48d 초기 프로젝트 구성: 반려동물 음악 롱폼 자동 생성 파이프라인
- ACE-Step 1.5 음악 생성 (과학적 근거 기반)
- FLUX 이미지 생성 (신카이 마코토 스타일)
- ffmpeg 영상 렌더링 (워터마크 포함)
- YouTube Data API 롱폼 업로드
- 프롬프트 및 문서 포함
2026-04-21 15:41:20 +09:00

8.9 KiB
Executable File

반려동물 음악 생성 가이드 (ACE-Step 1.5)

AI 서버의 ACE-Step 1.5를 활용한 과학 기반 반려동물 음악 생성


개요

항목
AI 모델 ACE-Step 1.5
서버 192.168.0.46
경로 /home/javamon/ACE-Step-1.5/
API 포트 8001
체크포인트 acestep-v15-turbo, acestep-5Hz-lm-1.7B, acestep-5Hz-lm-4B

과학적 근거

주요 연구

연구 저자 연도 핵심 발견
Influence of Auditory Stimulation on Dogs Wells, Graham, Hepper (Queen's Univ Belfast) 2002 클래식 → 수면 증가/짖기 감소, 헤비메탈 → 짖기/불안 증가
Behavioral Effects of Auditory Stimulation Kogan, Schoenfeld-Tacher, Simon (Colorado State) 2012 클래식 → 수면 시간 증가, 4개월간 45분 세션 관찰
Effect of Different Genres on Stress Levels Bowman, Dowell, Evans + Scottish SPCA (Glasgow) 2017 레게 + 소프트 록에서 HRV 최고 (스트레스 최소)
Effects of Music Pitch and Tempo Amaya, Satomura et al. 2020 느린 템포 → 최대 이완 / 저음 피치 → 경계심 유발
Effect of Music on Stress during Vet Visit King, Flint, Hunt, Werzowa, Logan 2022 품종 크기별 BPM 맞춤, 솔로 하프 효과 확인
Through a Dog's Ear Leeds, Spector, Wagner 2008 50-60 BPM 솔로 피아노에서 70%+ 진정 반응
Cats Prefer Species-Appropriate Music Snowdon, Teie (Univ of Wisconsin) 2015 고양이는 퍼링(25-50Hz) + 고음 성대(1000Hz+) 주파수에 반응

강아지 - 긍정 반응 유발 요소

파라미터 최적값 근거
템포 50-80 BPM Through a Dog's Ear: 50-60 BPM에서 70%+ 진정
장르 레게, 소프트 록, 클래식 Glasgow 2017: HRV 측정
악기 솔로 피아노, 하프, 어쿠스틱 기타 단순 편성일수록 효과적
다이나믹 pp~mp (매우 좁은 범위) King 2022
주파수 200Hz - 4kHz 중심 중음역 지배적
리듬 일정하고 예측 가능 싱코페이션 없음
화성 I-IV-V, 협화음만 단순 진행

강아지 - 품종 크기별 BPM (King 2022)

크기 안정시 심박수 권장 BPM
대형견 95 ± 20 75-115
중형견 100 ± 20 80-120
소형견 120 ± 20 100-140

고양이 - 긍정 반응 유발 요소

파라미터 최적값 근거
퍼링 주파수 25-50 Hz 드론 Snowdon & Teie 2015
성대 모방 1000-1600 Hz 슬라이딩 고양이 울음소리 주파수 대역
템포 느림 (50-60 BPM) 또는 퍼링 리듬 호흡/심박 동조
악기 첼로 하모닉스, 바이올린 고음부 고양이 성대 주파수와 유사
기법 포르타멘토, 글리산도 고양이 발성 모방

반드시 피해야 할 요소

요소 이유
헤비메탈/하드 록 짖기 증가, 몸 떨림 (Wells 2002, Kogan 2012)
빠른 템포 (>120 BPM) 각성도 증가
급격한 볼륨 변화 놀람 반응 유발
극저음 피치 공격 신호로 인식 (Morton 규칙)
높은 피치 날카로운 소리 짖기/공포 반응
복잡한 편성 진정 효과 감소
타악기 (드럼, 심벌) 예측 불가 충격음

ACE-Step 실행 방법

1. API 서버 시작

ssh javamon@192.168.0.46
cd /home/javamon/ACE-Step-1.5
source venv/bin/activate
python -m uvicorn acestep.api_server:app --host 0.0.0.0 --port 8001 --workers 1

2. 음악 생성 요청

curl -X POST http://192.168.0.46:8001/release_task \
  -H "Content-Type: application/json" \
  -d @request.json

3. 결과 조회

curl -X POST http://192.168.0.46:8001/query_result \
  -H "Content-Type: application/json" \
  -d '{"task_id": "<반환된 task_id>"}'

4. 오디오 다운로드

curl -o output.wav "http://192.168.0.46:8001/v1/audio?path=<파일경로>"

프롬프트 (강아지용)

A. 솔로 피아노 (최대 진정)

{
  "think": true,
  "caption": "Extremely gentle solo piano piece. Warm, soft touch with narrow dynamic range (pp to mp). Simple stepwise melody with small intervals, repetitive soothing phrases. Consonant harmony only, simple I-IV-V progression. Mid-range frequencies dominant (200Hz-4kHz). No bass rumble, no high-frequency shimmer. Gradual fade-in, meditative and peaceful. Designed for canine relaxation based on psychoacoustic research.",
  "lyrics": "[Instrumental]",
  "bpm": 58,
  "duration": 180,
  "keyscale": "C major",
  "language": "instrumental",
  "timesignature": "4"
}

B. 소프트 레게 (스트레스 감소)

{
  "think": true,
  "caption": "Gentle soft reggae instrumental with acoustic guitar offbeat skank and warm piano chords. Light bass in 100-250Hz range, no drums or percussion. Simple repetitive melody, tropical and mellow. Very narrow dynamic range, smooth and flowing with no sudden changes. Mid-range focused, relaxed and soothing atmosphere.",
  "lyrics": "[Instrumental]",
  "bpm": 68,
  "duration": 180,
  "keyscale": "G major",
  "language": "instrumental",
  "timesignature": "4"
}

C. 하프 클래식 (수의사 방문 전)

{
  "think": true,
  "caption": "Solo harp playing simplified classical arrangements. Gentle arpeggios with warm resonance, extremely soft dynamics. Predictable harmonic rhythm, no tempo changes. Narrow frequency range focused on mid-register. Calming, ethereal, spa-like atmosphere. Slow and deliberate with natural ring-out between phrases.",
  "lyrics": "[Instrumental]",
  "bpm": 54,
  "duration": 180,
  "keyscale": "F major",
  "language": "instrumental",
  "timesignature": "4"
}

프롬프트 (고양이용)

A. 퍼링 기반 앰비언트

{
  "think": true,
  "caption": "Ultra-soft ambient piece with cello harmonics and gentle violin in higher register (1000-1600Hz range). Purring-like low drone undertone. Sliding portamento notes mimicking cat vocalizations. Extremely quiet, meditative, no rhythm section. Slow glissando strings, warm ethereal pad. No percussion, no sudden dynamic changes. Based on feline acoustic frequency preferences.",
  "lyrics": "[Instrumental]",
  "bpm": 60,
  "duration": 180,
  "keyscale": "A major",
  "language": "instrumental",
  "timesignature": "4"
}

B. 고양이 자장가 (분리불안용)

{
  "think": true,
  "caption": "Delicate lullaby for cats with soft violin playing in the 1000-1500Hz range, mimicking feline vocal frequency. Gentle sustained notes with natural vibrato and portamento slides. Background warm pad with subtle purring rhythm (25-30Hz pulse). Extremely minimal, quiet, and predictable. No low bass, no percussion, no sharp attacks. Soothing and hypnotic repetition.",
  "lyrics": "[Instrumental]",
  "bpm": 55,
  "duration": 180,
  "keyscale": "D major",
  "language": "instrumental",
  "timesignature": "4"
}

활용 시나리오

상황 추천 프롬프트 시간
강아지 수면/휴식 솔로 피아노 (A) 3-5분 반복
강아지 분리불안 소프트 레게 (B) 30분+ 연속
수의사 방문 전 하프 클래식 (C) 이동 중 재생
고양이 휴식 퍼링 앰비언트 (A) 3-5분 반복
고양이 분리불안 고양이 자장가 (B) 30분+ 연속
유튜브 콘텐츠 강아지+고양이 혼합 1시간 영상용

유튜브 콘텐츠 연계 (향후)

  • 애니밀리 채널에 "반려동물 음악" 카테고리 추가 가능
  • 1시간 루프 영상 (수면음악, ASMR 류)
  • 과학적 근거 자막 오버레이로 차별화
  • ACE-Step으로 매일 다른 변주 자동 생성

참고문헌

  1. Wells DL, Graham L, Hepper PG (2002). The influence of auditory stimulation on the behaviour of dogs housed in a rescue shelter. Animal Welfare, 11, 385-393.
  2. Kogan LR, Schoenfeld-Tacher R, Simon AA (2012). Behavioral effects of auditory stimulation on kenneled dogs. Journal of Veterinary Behavior, 7, 268-275.
  3. Bowman A, Dowell FJ, Evans NP, Scottish SPCA (2017). The effect of different genres of music on the stress levels of kennelled dogs. Physiology & Behavior, 171, 207-215.
  4. Amaya V, Satomura H et al. (2020). Effects of music pitch and tempo on the behaviour of kennelled dogs. Animals, 11(1), 10.
  5. King C, Flint H, Hunt ABG, Werzowa S, Logan DW (2022). Effect of music on stress parameters in dogs during a mock veterinary visit. Frontiers in Veterinary Science.
  6. Leeds J, Spector L, Wagner S (2008). Through a Dog's Ear: Using Sound to Improve the Health & Behavior of Your Canine Companion.
  7. Snowdon CT, Teie D (2015). Affective responses in tamarins elicited by species-specific music. Biology Letters, 6(1), 30-32.
  8. Snowdon CT, Teie D, Savage M (2015). Cats prefer species-appropriate music. Applied Animal Behaviour Science, 166, 106-111.

작성: 2026-04-21