Spaces:

naohiro701
/

Fourier_Transform_Visualizer

Sleeping

App Files Files Community

naohiro701 commited on Jan 15, 2025

Commit

e531916

verified ·

1 Parent(s): 6a7c8d1

Update app.py

Browse files

Files changed (1) hide show

app.py +111 -187

app.py CHANGED Viewed

@@ -1,198 +1,122 @@
 import numpy as np
 import matplotlib.pyplot as plt
-from matplotlib.animation import FuncAnimation, FFMpegWriter
-from pydub import AudioSegment
-from scipy.fft import rfft, rfftfreq
-import streamlit as st
 import tempfile
 import os
 import subprocess
-import colorsys
-# ----- 設定 -----
-BASE_FREQUENCY = 440  # ラ(A4)基準
-NOTE_NAMES = ["A", "A#", "B", "C", "C#", "D", "D#", "E", "F", "F#", "G", "G#"]
-def frequency_to_color(freq):
-    """周波数 freq をノートに変換し、そのノートに対応したカラーを HSV->RGB で返す簡易関数。"""
-    if freq < BASE_FREQUENCY / 2:
-        return (0.5, 0.5, 0.5)  # gray
-    semitone_index = int(round(12 * np.log2(freq / BASE_FREQUENCY)))
-    note_idx = semitone_index % 12
-    # HSV 空間で色相を note_idx/12 として割り当て (S=1.0, V=1.0)
-    color_hsv = (note_idx / 12, 1.0, 1.0)
-    return colorsys.hsv_to_rgb(*color_hsv)
 def main():
-    st.title("周波数特性アート動画生成 (改良版)")
-    uploaded_file = st.file_uploader("音声ファイルをアップロード (MP3)", type=["mp3"])
-    if uploaded_file is None:
-        st.info("MP3ファイルをアップロードしてください。")
-        return
-    # ----- Step1: MP3 -> AudioSegment 変換 -----
-    with tempfile.NamedTemporaryFile(delete=False, suffix=".mp3") as temp_mp3:
-        temp_mp3.write(uploaded_file.read())
-        audio = AudioSegment.from_file(temp_mp3.name)
-    # ----- Step2: numpy配列化 -----
-    samples = np.array(audio.get_array_of_samples(), dtype=float)
-    sample_rate = audio.frame_rate
-    # ステレオ → モノラル
-    if audio.channels == 2:
-        samples = samples.reshape((-1, 2)).mean(axis=1)
-    # 正規化（-1～1）
-    samples /= np.iinfo(audio.array_type).max
-    st.write(f"サンプリングレート: {sample_rate} Hz")
-    st.write(f"サンプル数: {len(samples)}")
-    # FFT パラメータ
-    chunk_size = 2048
-    overlap = 1024
-    step_size = chunk_size - overlap
-    freqs = rfftfreq(chunk_size, d=1/sample_rate)
-    # チャンク数
-    n_chunks = (len(samples) - chunk_size) // step_size + 1
-    st.write(f"フレーム数: {n_chunks}")
-    # 各チャンクの FFT -> ピーク周波数 & 総エネルギー取得
-    peak_freqs = []
-    total_amps = []
-    window = np.hanning(chunk_size)
-    for i in range(n_chunks):
-        start = i * step_size
-        end = start + chunk_size
-        chunk = samples[start:end] * window
-        spectrum = np.abs(rfft(chunk))
-        peak_index = np.argmax(spectrum)
-        peak_freq = freqs[peak_index]
-        peak_freqs.append(peak_freq)
-        total_amp = np.sum(spectrum)
-        total_amps.append(total_amp)
-    peak_freqs = np.array(peak_freqs)
-    total_amps = np.array(total_amps)
-    # ----- Step3: Matplotlib アニメーション作成 -----
-    fig, ax = plt.subplots(figsize=(6, 6))
-    # まずは白背景でテストする場合
-    fig.patch.set_facecolor("white")
-    ax.set_facecolor("white")         # 背景を白に変更
-    ax.set_xlim(-2, 2)                # 描画範囲を少し拡大
-    ax.set_ylim(-2, 2)
-    ax.set_aspect("equal")
-    ax.axis("off")
-    # 初期化: 座標は空
-    scatter_plot = ax.scatter(
-        np.empty(0),
-        np.empty(0),
-        s=10,
-        c=[],
-        alpha=0.9
-    )
-    # スパイラルのベース座標
-    num_points = 200
-    angles = np.linspace(0, 4 * np.pi, num_points)
-    radii = np.linspace(0.05, 0.5, num_points)
-    x_base = radii * np.cos(angles)
-    y_base = radii * np.sin(angles)
-    def init():
-        # 2次元配列で空データを渡す
-        scatter_plot.set_offsets(np.empty((0, 2)))
-        return (scatter_plot,)
-    def update(frame):
-        """
-        各フレームで呼ばれる描画更新関数。
-        frame: 0 ~ n_chunks-1
-        """
-        p_freq = peak_freqs[frame]                      # ピーク周波数
-        c = frequency_to_color(p_freq)                  # 周波数に応じた色
-        amp_scale = np.log10(total_amps[frame] + 1)     # 総エネルギー -> 対数スケール
-        # スパイラル座標をフレームごとに回転・変形
-        theta_shift = 0.1 * frame
-        x_mod = x_base * (1 + 0.05 * np.sin(theta_shift))
-        y_mod = y_base * (1 + 0.05 * np.cos(theta_shift))
-        rot = 0.05 * frame
-        cos_r = np.cos(rot)
-        sin_r = np.sin(rot)
-        x_rot = x_mod * cos_r - y_mod * sin_r
-        y_rot = x_mod * sin_r + y_mod * cos_r
-        # 座標更新
-        coords = np.column_stack((x_rot, y_rot))
-        scatter_plot.set_offsets(coords)
-        # 点のサイズ更新 (もっと大きくしてみる)
-        sizes = (100 + 300 * amp_scale) * np.ones(num_points)
-        scatter_plot.set_sizes(sizes)
-        # 全点同じ色
-        colors = np.array([c for _ in range(num_points)])
-        scatter_plot.set_facecolor(colors)
-        return (scatter_plot,)
-    # blit=False でアニメーションを作る
-    ani = FuncAnimation(
-        fig,
-        update,
-        frames=n_chunks,
-        init_func=init,
-        interval=50,  # インターバル少し長めに
-        blit=False     # ← 重要ポイント
-    )
-    # ----- Step4: Matplotlib アニメーションを一時ファイルに保存 (.mp4) -----
-    video_temp = tempfile.NamedTemporaryFile(delete=False, suffix=".mp4")
-    video_path = video_temp.name
-    video_temp.close()
-    writer = FFMpegWriter(fps=30, codec="libx264")
-    ani.save(video_path, writer=writer, dpi=150)
-    plt.close(fig)
-    # ----- Step5: 音声と合成する -----
-    audio_path = tempfile.NamedTemporaryFile(delete=False, suffix=".wav").name
-    audio.export(audio_path, format="wav")
-    output_path = tempfile.NamedTemporaryFile(delete=False, suffix="_output.mp4").name
-    ffmpeg_command = [
-        "ffmpeg", "-y",
-        "-i", video_path,
-        "-i", audio_path,
-        "-c:v", "copy",
-        "-c:a", "aac",
-        output_path
-    ]
-    subprocess.run(ffmpeg_command)
-    # ----- Step6: Streamlit に動画を表示 -----
-    st.video(output_path)
-    # ----- Cleanup -----
-    os.remove(video_path)
-    os.remove(audio_path)
-    os.remove(output_path)
-    os.remove(temp_mp3.name)
 if __name__ == "__main__":
     main()

+import streamlit as st
 import numpy as np
 import matplotlib.pyplot as plt
+from matplotlib.animation import FuncAnimation
 import tempfile
 import os
 import subprocess
+from pydub import AudioSegment
+from scipy.fft import rfft, rfftfreq
+from scipy.signal import get_window
 def main():
+    st.title("フーリエサイケデリックアート")
+    uploaded_file = st.file_uploader("アートに変換する音声ファイルをアップロード (MP3)", type=["mp3"])
+    if uploaded_file is not None:
+        st.write("**アップロード完了**。少々お待ちください...")
+        # --- Step 1: MP3 -> WAV 変換 ---
+        with tempfile.NamedTemporaryFile(delete=False, suffix=".mp3") as temp_mp3:
+            temp_mp3.write(uploaded_file.read())
+            audio = AudioSegment.from_file(temp_mp3.name)
+        # numpy 配列に変換（Mono化 & 正規化）
+        samples = np.array(audio.get_array_of_samples(), dtype=float)
+        sample_rate = audio.frame_rate
+        # ステレオの場合はモノラルへ変換
+        if audio.channels == 2:
+            samples = samples.reshape((-1, 2))
+            samples = samples.mean(axis=1)
+        # 整数の場合の最大値で正規化（16bit or 32bitなどに対応）
+        samples /= np.max(np.abs(samples))
+        # --- パラメータ ---
+        chunk_size = 2048
+        overlap = 1024
+        step_size = chunk_size - overlap
+        # FFT の準備
+        window = get_window("hann", chunk_size)
+        freqs = rfftfreq(chunk_size, d=1/sample_rate)
+        max_freq = np.max(freqs)
+        # チャンク数の計算
+        n_chunks = (len(samples) - chunk_size) // step_size + 1
+        # 各チャンクでの FFT を先にまとめて計算しておく
+        fft_frames = []
+        for i in range(n_chunks):
+            start = i * step_size
+            end = start + chunk_size
+            chunk = samples[start:end] * window
+            spec = np.abs(rfft(chunk))
+            fft_frames.append(spec)
+        # --- Step 2: Matplotlib アニメーションを作成 ---
+        fig = plt.figure(figsize=(6, 6))
+        ax = plt.subplot(111, projection='polar')
+        plt.axis('off')  # 軸は消してサイケ感を出す
+        # 初期化用
+        theta = freqs / max_freq * 2 * np.pi  # 周波数を角度にマッピング
+        r_init = fft_frames[0]
+        # カラーマップの初期表示
+        sc = ax.scatter(theta, r_init, c=r_init, cmap="hsv", alpha=0.7)
+        # 半径方向(Amplitude)の最大値を固定
+        ax.set_ylim(0, np.max(fft_frames))
+        # 背景色を黒に
+        fig.patch.set_facecolor("black")
+        ax.set_facecolor("black")
+        def update(frame):
+            """各フレームでの散布図を更新。"""
+            r = fft_frames[frame]
+            # 散布図を更新 (colors, offsetsなどを更新)
+            sc.set_offsets(np.column_stack((theta, r)))  # (theta, radius) をまとめる
+            sc.set_array(r)  # カラーマップ用
+            return (sc,)
+        ani = FuncAnimation(fig, update, frames=len(fft_frames), blit=True, interval=50)
+        # --- Step 3: アニメーションを一時的に MP4 に保存 ---
+        with tempfile.NamedTemporaryFile(delete=False, suffix=".mp4") as temp_video:
+            ani.save(temp_video.name, fps=30, extra_args=["-vcodec", "libx264"])
+            video_path = temp_video.name
+        # --- Step 4: 音声ファイル(WAV) を出力 ---
+        audio_path = tempfile.NamedTemporaryFile(delete=False, suffix=".wav").name
+        audio.export(audio_path, format="wav")
+        # --- Step 5: FFmpeg で音声と動画を合成 ---
+        output_path = tempfile.NamedTemporaryFile(delete=False, suffix="_output.mp4").name
+        ffmpeg_command = [
+            "ffmpeg", "-y",
+            "-i", video_path,
+            "-i", audio_path,
+            "-c:v", "copy",
+            "-c:a", "aac",
+            "-strict", "experimental",  # 必要に応じて
+            output_path
+        ]
+        subprocess.run(ffmpeg_command, stdout=subprocess.PIPE, stderr=subprocess.PIPE)
+        # --- Step 6: Streamlit で表示 ---
+        st.write("**アート生成完了！** 以下の動画をお楽しみください。")
+        st.video(output_path)
+        # 後片付け
+        os.remove(temp_mp3.name)
+        os.remove(video_path)
+        os.remove(audio_path)
+        os.remove(output_path)
 if __name__ == "__main__":
     main()