偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

每張圖片自帶BGM?牛津小哥開源神器,實現(xiàn)任意圖像轉(zhuǎn)換聲譜圖

新聞 開源
給你一張圖片,你能想象它的聲音嗎?一個叫SpectroGraphic的神器就能做到這點。

本文經(jīng)AI新媒體量子位(公眾號ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。

 給你一張圖片,你能想象它的聲音嗎?

一個叫SpectroGraphic的神器就能做到這點。

每張圖片自帶BGM?牛津小哥開源神器,實現(xiàn)任意圖像轉(zhuǎn)換聲譜圖

例如,給定一個“怪物史萊克”的照片,通過這個工具,就能生成其對應(yīng)的聲譜圖

每張圖片自帶BGM?牛津小哥開源神器,實現(xiàn)任意圖像轉(zhuǎn)換聲譜圖

圖像嵌入聲譜圖

大多數(shù)聲音是許多聲波的復(fù)雜組合,而每一種聲波都有不同的頻率和強度。

聲譜圖(spectrogram)是一種表示聲音的方法,它的橫軸是時間,縱軸是頻譜。

每張圖片自帶BGM?牛津小哥開源神器,實現(xiàn)任意圖像轉(zhuǎn)換聲譜圖
△聲譜圖示例

SpectroGraphic所做的工作就是獲取一張圖像,簡單地把它解釋成一張聲譜圖。

這樣,就可以通過產(chǎn)生的聲音,便將圖像嵌入到了聲譜圖中。

是不是非常酷炫?

現(xiàn)在,項目已開源,每個人都可以體驗了!

項目安裝

首先,運行如下代碼來獲取命令行工具spectrographic:

  1. pipinstallspectrographic 

也可以直接把stand-alone\文件夾里的spectrographic.py文件,作為命令行工具使用。

每張圖片自帶BGM?牛津小哥開源神器,實現(xiàn)任意圖像轉(zhuǎn)換聲譜圖

此外,還需要確保滿足 requirements.txt 文件中涉及的所有依賴項。

可以通過如下命令來進行安裝:

  1. pipinstallrequirements.txt 

在使用 pip 進行安裝之后,只需要在控制臺中運行 spectrographic […]。

在使用stand-alone腳本時,必須使用 python spectrographic.py […]。

還可以簡單地從 SpectroGraphic.base 中導(dǎo)入 SpectroGraphic 類。

命令行工具的使用

  1. usage:spectrographic[-h][--version]-iPATH_TO_IMAGE[-dDURATION][-mMIN_FREQ][-MMAX_FREQ][-rRESOLUTION][-cCONTRAST][-p][-sSAVE_FILE]Turnanyimageintosound.optionalarguments:-h,--helpshowthishelpmessageandexit--versionshowprogram'sversionnumberandexit-iPATH_TO_IMAGE,--imagePATH_TO_IMAGEPathofimagethatwewanttoembedinaspectrogram.-dDURATION,--durationDURATIONDurationofgeneratedsound.-mMIN_FREQ,--min_freqMIN_FREQSmallestfrequencyusedfordrawingtheimage.-MMAX_FREQ,--max_freqMAX_FREQLargestfrequencyusedfordrawingtheimage.-rRESOLUTION,--resolutionRESOLUTIONVerticalresolutionoftheimageinthespectrogram.-cCONTRAST,--contrastCONTRASTContrastoftheimageinthespectrogram.-p,--playDirectlyplaytheresultingsound.-sSAVE_FILE,--saveSAVE_FILEPathto.wavfileinwhichtosavetheresultingsound. 

如果你的源圖像在./source.png,想要生成10s的音頻,頻率范圍為10kHz到20kHz,還希望保存為sound.wav,最終還要播放音頻。

那么就運行如下代碼:

  1. spectrographic--image./source.png--min_freq10000--max_freq20000--duration10--savesound.wav--play 

如果你正在使用stand-alone腳本:

  1. pythonspectrographic.py--image./source.png--min_freq10000--max_freq20000--duration10--savesound.wav--play 

作者簡介

[[312724]]
△右:Levi Borodenko

Levi Borodenko,目前在牛津大學攻讀數(shù)學和統(tǒng)計學碩士學位。學術(shù)研究重點是隨機分析和機器學習。

本科也就讀于牛津大學,2017-2018擔任PROMYS Oxford的輔導(dǎo)員,2018-2019年擔任PROMYS Boston的首席輔導(dǎo)員。

更多開源項目可訪問如下鏈接:
https://github.com/LeviBorodenko

傳送門

項目地址:
https://github.com/LeviBorodenko/spectrographic

 

責任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2012-06-20 13:46:23

CSS

2023-07-18 17:59:38

2023-12-01 08:09:45

開源圖片編輯器

2022-06-27 22:03:04

CSS技巧前端

2020-05-22 15:45:30

Linuxlogrotate神器

2021-08-16 11:59:32

Linuxlogrotate日志文件

2025-04-24 08:23:59

2025-03-26 00:35:00

Javaweb開發(fā)

2024-02-05 12:45:33

AI訓練

2025-06-04 13:53:57

AI模型Meta

2025-02-17 07:48:45

2024-07-26 09:19:41

2021-02-21 09:25:41

開源技術(shù) 工具

2021-05-25 09:10:54

工具代碼開發(fā)

2023-03-20 13:43:00

AI論文

2015-08-21 17:52:52

逆向分析BinNavi

2024-10-25 11:56:33

OCRVisRAGRAG

2019-12-23 10:22:05

AI 數(shù)據(jù)人工智能

2019-07-09 12:30:50

開源技術(shù) 軟件

2009-08-13 09:07:36

Java多線程
點贊
收藏

51CTO技術(shù)棧公眾號