Spaces:

teticio
/

audio-diffusion

Runtime error

App Files Files Community

teticio commited on Oct 4, 2022

Commit

f67abdb

1 Parent(s): 5be865c

fix remix

Browse files

Files changed (1) hide show

notebooks/test_model.ipynb +15 -36

notebooks/test_model.ipynb CHANGED Viewed

@@ -90,7 +90,7 @@
   {
    "cell_type": "code",
    "execution_count": null,
-   "id": "9b52c13c",
    "metadata": {},
    "outputs": [],
    "source": [
@@ -181,7 +181,7 @@
   },
   {
    "cell_type": "markdown",
-   "id": "daa4a41e",
    "metadata": {},
    "source": [
     "### Generate continuations (\"out-painting\")"
@@ -190,7 +190,7 @@
   {
    "cell_type": "code",
    "execution_count": null,
-   "id": "5e73e629",
    "metadata": {},
    "outputs": [],
    "source": [
@@ -245,26 +245,14 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 9,
    "id": "5a257e69",
    "metadata": {
-    "scrolled": true
    },
-   "outputs": [
-    {
-     "ename": "NameError",
-     "evalue": "name 'sample_rate' is not defined",
-     "output_type": "error",
-     "traceback": [
-      "\u001b[0;31m---------------------------------------------------------------------------\u001b[0m",
-      "\u001b[0;31mNameError\u001b[0m                                 Traceback (most recent call last)",
-      "Input \u001b[0;32mIn [9]\u001b[0m, in \u001b[0;36m<cell line: 10>\u001b[0;34m()\u001b[0m\n\u001b[1;32m     11\u001b[0m generator\u001b[38;5;241m.\u001b[39mmanual_seed(seed)\n\u001b[1;32m     12\u001b[0m audio \u001b[38;5;241m=\u001b[39m np\u001b[38;5;241m.\u001b[39marray(mel\u001b[38;5;241m.\u001b[39maudio[sample \u001b[38;5;241m*\u001b[39m stride:sample \u001b[38;5;241m*\u001b[39m stride \u001b[38;5;241m+\u001b[39m slice_size])\n\u001b[0;32m---> 13\u001b[0m display(Audio(audio, rate\u001b[38;5;241m=\u001b[39m\u001b[43msample_rate\u001b[49m))\n\u001b[1;32m     14\u001b[0m \u001b[38;5;28;01mif\u001b[39;00m \u001b[38;5;28mlen\u001b[39m(track) \u001b[38;5;241m>\u001b[39m \u001b[38;5;241m0\u001b[39m:\n\u001b[1;32m     15\u001b[0m     \u001b[38;5;66;03m# Normalize and re-insert generated audio\u001b[39;00m\n\u001b[1;32m     16\u001b[0m     audio[:overlap_samples] \u001b[38;5;241m=\u001b[39m audio2[\u001b[38;5;241m-\u001b[39moverlap_samples:] \u001b[38;5;241m*\u001b[39m np\u001b[38;5;241m.\u001b[39mmax(\n\u001b[1;32m     17\u001b[0m         audio[:overlap_samples]) \u001b[38;5;241m/\u001b[39m np\u001b[38;5;241m.\u001b[39mmax(audio2[\u001b[38;5;241m-\u001b[39moverlap_samples:])\n",
-      "\u001b[0;31mNameError\u001b[0m: name 'sample_rate' is not defined"
-     ]
-    }
-   ],
    "source": [
-    "start_step = 500  #@param {type:\"slider\", min:0, max:1000, step:10}\n",
     "overlap_secs = 2  #@param {type:\"integer\"}\n",
     "mel.load_audio(audio_file)\n",
     "overlap_samples = overlap_secs * mel.get_sample_rate()\n",
@@ -273,11 +261,11 @@
     "generator = torch.Generator()\n",
     "seed = generator.seed()\n",
     "track = np.array([])\n",
     "for sample in range(len(mel.audio) // stride):\n",
     "    generator.manual_seed(seed)\n",
     "    audio = np.array(mel.audio[sample * stride:sample * stride + slice_size])\n",
-    "    display(Audio(audio, rate=mel.get_sample_rate()))\n",
-    "    if len(track) > 0:\n",
     "        # Normalize and re-insert generated audio\n",
     "        audio[:overlap_samples] = audio2[-overlap_samples:] * np.max(\n",
     "            audio[:overlap_samples]) / np.max(audio2[-overlap_samples:])\n",
@@ -286,24 +274,15 @@
     "            raw_audio=audio,\n",
     "            start_step=start_step,\n",
     "            generator=generator,\n",
-    "            mask_start_secs=overlap_secs if len(track) > 0 else 0)\n",
-    "    display(Audio(audio2, rate=sample_rate))\n",
-    "    track = np.concatenate([track, audio2[overlap_samples:]])"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "id": "8f5ed5d8",
-   "metadata": {},
-   "outputs": [],
-   "source": [
-    "display(Audio(track, rate=sample_rate))"
    ]
   },
   {
    "cell_type": "markdown",
-   "id": "61f2ed2a",
    "metadata": {},
    "source": [
     "### Fill the gap (\"in-painting\")"
@@ -312,7 +291,7 @@
   {
    "cell_type": "code",
    "execution_count": null,
-   "id": "8cad545c",
    "metadata": {},
    "outputs": [],
    "source": [

   {
    "cell_type": "code",
    "execution_count": null,
+   "id": "4dc17ac0",
    "metadata": {},
    "outputs": [],
    "source": [
   },
   {
    "cell_type": "markdown",
+   "id": "58a876c1",
    "metadata": {},
    "source": [
     "### Generate continuations (\"out-painting\")"
   {
    "cell_type": "code",
    "execution_count": null,
+   "id": "b95d5780",
    "metadata": {},
    "outputs": [],
    "source": [
   },
   {
    "cell_type": "code",
+   "execution_count": null,
    "id": "5a257e69",
    "metadata": {
+    "scrolled": false
    },
+   "outputs": [],
    "source": [
+    "start_step = 600  #@param {type:\"slider\", min:0, max:1000, step:10}\n",
     "overlap_secs = 2  #@param {type:\"integer\"}\n",
     "mel.load_audio(audio_file)\n",
     "overlap_samples = overlap_secs * mel.get_sample_rate()\n",
     "generator = torch.Generator()\n",
     "seed = generator.seed()\n",
     "track = np.array([])\n",
+    "not_first = 0\n",
     "for sample in range(len(mel.audio) // stride):\n",
     "    generator.manual_seed(seed)\n",
     "    audio = np.array(mel.audio[sample * stride:sample * stride + slice_size])\n",
+    "    if not_first:\n",
     "        # Normalize and re-insert generated audio\n",
     "        audio[:overlap_samples] = audio2[-overlap_samples:] * np.max(\n",
     "            audio[:overlap_samples]) / np.max(audio2[-overlap_samples:])\n",
     "            raw_audio=audio,\n",
     "            start_step=start_step,\n",
     "            generator=generator,\n",
+    "            mask_start_secs=overlap_secs * not_first)\n",
+    "    track = np.concatenate([track, audio2[overlap_samples * not_first:]])\n",
+    "    not_first = 1\n",
+    "    display(Audio(track, rate=sample_rate))"
    ]
   },
   {
    "cell_type": "markdown",
+   "id": "924ff9d5",
    "metadata": {},
    "source": [
     "### Fill the gap (\"in-painting\")"
   {
    "cell_type": "code",
    "execution_count": null,
+   "id": "0200264c",
    "metadata": {},
    "outputs": [],
    "source": [