

XQR (parte 3): "Vede la luce il sistema di editing guidato dall'AI"
Sep 8, 2025
27:22
Titolo episodio: XQR, Transcriber e LLM per il pre-montaggio (con Alex Raccuglia) 🎧🛠️
Breve riassunto
Alex racconta lo stato dei suoi strumenti per il montaggio/trascrizione: XQR e NQR, le novità introdotte in Transcriber (generazione del contesto, gradi di “aderenza” delle frasi, metadati, estrazione di sottoliste e capitoli) e come sfrutta modelli LLM per automatizzare il pre-montaggio video/audio. Condivide risultati, tempi di elaborazione, limiti (sincronia e accuratezza dei timecode) e idee future (capitoli JSON, individuazione delle frasi più impattanti per il lancio). Chiude con note personali sulle vacanze e qualche aneddoto d’ufficio. 🎬🤖
Ospiti / Interviste
- Nessuna intervista né ospite esterno: episodio a cura di Alex Raccuglia (host, sviluppatore/regista/producer).
Brand, nomi, servizi e link citati (con descrizione)
- Alex Raccuglia — conduttore dell’episodio; sviluppatore e regista/producer che lavora sui tool presentati.
- Techno Pillz — il podcast (creato e condotto da Alex) nel podcast network Runtime Radio.
- Runtime Radio — podcast network citato come contesto di produzione.
- XQR / NQR — strumenti/app citati da Alex:
- XQR: componente di elaborazione/estrazione usata per creare sottoliste e comporre prompt.
- NQR: applicazione che “racchiude tutte le possibilità ” e permette di comporre prompt; integra anche copia/incolla di codice Swift.
- Transcriber — applicazione in cui Alex ha implementato le funzionalità descritte: generazione contesto, valutazione aderenza frase‑contesto (tanto/poco/nullo), metadati, estrazione sottoliste e capitoli.
- Modelli GPT / LLM (citati) — Alex confronta diversi modelli:
- “nano” (modello economico, poco performante sul task)
- “gpt‑4.1 mini” (modello intermedio che dà risultati soddisfacenti)
- riferimento a gpt‑3.5 e gpt‑4.1 classico per confronto di prestazioni/costi
(nota: sono menzionati come tipologie di modelli LLM usati per il processamento e il riassunto).
- Swift — riferimento al codice Swift (linguaggio) che NQR permette di copiare/incollare comodamente.
- Producer (menzione generica) — Alex ipotizza l’uso del sistema anche in un prodotto tipo “Producer” per supportare il montaggio in background (non è indicato un prodotto specifico con link).
- Spotify / Apple Podcasts — piattaforme citate come canali dove lasciare like/recensioni.
- Telegram / gruppo Techno Pillz:
- telegram.me/technopillsriot — gruppo Telegram citato per contatti e suggerimenti.
- Numero telefonico citato: 392 87 077 65 — numero che Alex invita a contattare (come da trascrizione).
Note tecniche e takeaways rapidi
- Funziona: estrazione sottoliste e generazione capitoli usando LLM — risultati buoni usando modelli più potenti (gpt‑4.1 mini), ma non perfetti.
- Tempi: un’ora di video (~400 frasi) → 5–8 min di processamento + ~30–35s per estrarre le sottofrasi finali.
- Limiti: precisione dei timecode non 100% (quindi è pre‑montaggio basato sul testo, non montaggio finale completo); occasionali errori di formato dell’output LLM (numeri dispari di frasi, sincronie).
- Idee future: output JSON blindato per i capitoli, estrazione delle “frasi più impattanti” per clip di lancio, migliorare UI/UX di Transcriber.
Emoji finali
Se ti interessa l’editing assistito da AI, i tool per transcribe/summary e i trucchi su come parlare agli LLM, questo episodio è per te. Buon ascolto e lasciaci un feedback! 🚀💬
[00:10:47] Spot
[00:17:41] Spot
[00:26:55] Il riassunto di Sciatta GPT
TechnoPillz
Flusso di coscienza digitale.
Vieni a chiacchierare sul riot:
https://t.me/TechnoPillzRiot
Sono su Mastodon: @shylock74@mastodon.uno
I video di The Morning Rant sul canale YouTube di Runtime:
https://www.youtube.com/playlist?list=PLgGSK_Rq9Xdh1ojZ_Qi-rCwwae_n2Lmzt
Ascoltaci live tutti i giorni 24/7 su: http://runtimeradio.it
Scarica l’app per iOS: https://bit.ly/runtApp
Contribuisci alla Causa andando su:
http://runtimeradio.it/ancheio/
Breve riassunto
Alex racconta lo stato dei suoi strumenti per il montaggio/trascrizione: XQR e NQR, le novità introdotte in Transcriber (generazione del contesto, gradi di “aderenza” delle frasi, metadati, estrazione di sottoliste e capitoli) e come sfrutta modelli LLM per automatizzare il pre-montaggio video/audio. Condivide risultati, tempi di elaborazione, limiti (sincronia e accuratezza dei timecode) e idee future (capitoli JSON, individuazione delle frasi più impattanti per il lancio). Chiude con note personali sulle vacanze e qualche aneddoto d’ufficio. 🎬🤖
Ospiti / Interviste
- Nessuna intervista né ospite esterno: episodio a cura di Alex Raccuglia (host, sviluppatore/regista/producer).
Brand, nomi, servizi e link citati (con descrizione)
- Alex Raccuglia — conduttore dell’episodio; sviluppatore e regista/producer che lavora sui tool presentati.
- Techno Pillz — il podcast (creato e condotto da Alex) nel podcast network Runtime Radio.
- Runtime Radio — podcast network citato come contesto di produzione.
- XQR / NQR — strumenti/app citati da Alex:
- XQR: componente di elaborazione/estrazione usata per creare sottoliste e comporre prompt.
- NQR: applicazione che “racchiude tutte le possibilità ” e permette di comporre prompt; integra anche copia/incolla di codice Swift.
- Transcriber — applicazione in cui Alex ha implementato le funzionalità descritte: generazione contesto, valutazione aderenza frase‑contesto (tanto/poco/nullo), metadati, estrazione sottoliste e capitoli.
- Modelli GPT / LLM (citati) — Alex confronta diversi modelli:
- “nano” (modello economico, poco performante sul task)
- “gpt‑4.1 mini” (modello intermedio che dà risultati soddisfacenti)
- riferimento a gpt‑3.5 e gpt‑4.1 classico per confronto di prestazioni/costi
(nota: sono menzionati come tipologie di modelli LLM usati per il processamento e il riassunto).
- Swift — riferimento al codice Swift (linguaggio) che NQR permette di copiare/incollare comodamente.
- Producer (menzione generica) — Alex ipotizza l’uso del sistema anche in un prodotto tipo “Producer” per supportare il montaggio in background (non è indicato un prodotto specifico con link).
- Spotify / Apple Podcasts — piattaforme citate come canali dove lasciare like/recensioni.
- Telegram / gruppo Techno Pillz:
- telegram.me/technopillsriot — gruppo Telegram citato per contatti e suggerimenti.
- Numero telefonico citato: 392 87 077 65 — numero che Alex invita a contattare (come da trascrizione).
Note tecniche e takeaways rapidi
- Funziona: estrazione sottoliste e generazione capitoli usando LLM — risultati buoni usando modelli più potenti (gpt‑4.1 mini), ma non perfetti.
- Tempi: un’ora di video (~400 frasi) → 5–8 min di processamento + ~30–35s per estrarre le sottofrasi finali.
- Limiti: precisione dei timecode non 100% (quindi è pre‑montaggio basato sul testo, non montaggio finale completo); occasionali errori di formato dell’output LLM (numeri dispari di frasi, sincronie).
- Idee future: output JSON blindato per i capitoli, estrazione delle “frasi più impattanti” per clip di lancio, migliorare UI/UX di Transcriber.
Emoji finali
Se ti interessa l’editing assistito da AI, i tool per transcribe/summary e i trucchi su come parlare agli LLM, questo episodio è per te. Buon ascolto e lasciaci un feedback! 🚀💬
[00:10:47] Spot
[00:17:41] Spot
[00:26:55] Il riassunto di Sciatta GPT
TechnoPillz
Flusso di coscienza digitale.
Vieni a chiacchierare sul riot:
https://t.me/TechnoPillzRiot
Sono su Mastodon: @shylock74@mastodon.uno
I video di The Morning Rant sul canale YouTube di Runtime:
https://www.youtube.com/playlist?list=PLgGSK_Rq9Xdh1ojZ_Qi-rCwwae_n2Lmzt
Ascoltaci live tutti i giorni 24/7 su: http://runtimeradio.it
Scarica l’app per iOS: https://bit.ly/runtApp
Contribuisci alla Causa andando su:
http://runtimeradio.it/ancheio/