科学音频处理(二):如何使用 Octave 对音频文件进行基本数学信号处理

系统 Linux 系统运维
在前一篇的指导教程中,我们看到了读、写以及重放音频文件的简单步骤,我们甚至看到如何从一个周期函数比如余弦函数合成一个音频文件。在这篇指导教程中,我们将会看到如何对信号进行叠加和倍乘(调整),并应用一些基本的数学函数看看它们对原始信号的影响。

[[174884]]

前一篇的指导教程中,我们看到了读、写以及重放音频文件的简单步骤,我们甚至看到如何从一个周期函数比如余弦函数合成一个音频文件。在这篇指导教程中,我们将会看到如何对信号进行叠加和倍乘(调整),并应用一些基本的数学函数看看它们对原始信号的影响。

信号叠加

两个信号 S1(t)和 S2(t)相加形成一个新的信号 R(t),这个信号在任何瞬间的值等于构成它的两个信号在那个时刻的值之和。就像下面这样:

  1. R(t) = S1(t) + S2(t) 

我们将用 Octave 重新产生两个信号的和并通过图表看达到的效果。首先,我们生成两个不同频率的信号,看一看它们的叠加信号是什么样的。

***步:产生两个不同频率的信号(oog 文件)

  1. >> sig1='cos440.ogg';                  %creating the audio file @440 Hz 
  2. >> sig2='cos880.ogg';                  %creating the audio file @880 Hz 
  3. >> fs=44100;                           %generating the parameters values (Period, sampling frequency and angular frequency) 
  4. >> t=0:1/fs:0.02; 
  5. >> w1=2*pi*440*t; 
  6. >> w2=2*pi*880*t; 
  7. >> audiowrite(sig1,cos(w1),fs);        %writing the function cos(w) on the files created 
  8. >> audiowrite(sig2,cos(w2),fs); 

然后我们绘制出两个信号的图像。

信号 1 的图像(440 赫兹)

  1. >> [y1, fs] = audioread(sig1); 
  2. >> plot(y1) 

 

 

 信号 1 的图像

信号 2 的图像(880 赫兹)

  1. >> [y2, fs] = audioread(sig2); 
  2. >> plot(y2) 

 

 信号 2 的图像

第二步:把两个信号叠加

现在我们展示一下前面步骤中产生的两个信号的和。

  1. >> sumres=y1+y2; 
  2. >> plot(sumres) 

叠加信号的图像

 和信号的图像

Octaver 中的效果

在 Octaver 中,这个效果产生的声音是独特的,因为它可以仿真音乐家弹奏的低八度或者高八度音符(取决于内部程序设计),仿真音符和原始音符成对,也就是两个音符发出相同的声音。

第三步:把两个真实的信号相加(比如两首音乐歌曲)

为了实现这个目的,我们使用格列高利圣咏(Gregorian Chants)中的两首歌曲(声音采样)。

圣母颂曲(Avemaria Track)

首先,我们看一下圣母颂曲并绘出它的图像:

  1. >> [y1,fs]=audioread('avemaria_.ogg'); 
  2. >> plot(y1) 

 

 圣母歌曲

赞美诗曲(Hymnus Track)

现在我们看一下赞美诗曲并绘出它的图像。

  1. >> [y2,fs]=audioread('hymnus.ogg'); 
  2. >> plot(y2) 

 

 

 赞美诗曲

圣母颂曲 + 赞美诗曲

  1. >> y='avehymnus.ogg'
  2. >> audiowrite(y, y1+y2, fs); 
  3. >> [y, fs]=audioread('avehymnus.ogg'); 
  4. >> plot(y) 

 

 

 圣母歌曲 + 赞美诗曲

结果,从音频的角度来看,两个声音信号混合在了一起。

两个信号的乘积

对于求两个信号的乘积,我们可以使用类似求和的方法。我们使用之前生成的相同文件。

  1. R(t) = S1(t) * S2(t)  
  1. >> sig1='cos440.ogg';                  %creating the audio file @440 Hz 
  2. >> sig2='cos880.ogg';                  %creating the audio file @880 Hz 
  3. >> product='prod.ogg';                 %creating the audio file for product 
  4. >> fs=44100;                           %generating the parameters values (Period, sampling frequency and angular frequency) 
  5. >> t=0:1/fs:0.02; 
  6. >> w1=2*pi*440*t; 
  7. >> w2=2*pi*880*t; 
  8. >> audiowrite(sig1, cos(w1), fs);      %writing the function cos(w) on the files created 
  9. >> audiowrite(sig2, cos(w2), fs);>> [y1,fs]=audioread(sig1);>> [y2,fs]=audioread(sig2); 
  10. >> audiowrite(product, y1.*y2, fs);    %performing the product 
  11. >> [yprod,fs]=audioread(product); 
  12. >> plot(yprod);                        %plotting the product 

注意:我们必须使用操作符 ‘.*’,因为在参数文件中,这个乘积是值与值相乘。更多信息,请参考 Octave 矩阵操作产品手册。

乘积生成信号的图像

 乘积信号的图像

两个基本频率相差很大的信号相乘后的图表效果(调制原理)

***步:

生成两个频率为 220 赫兹的声音信号。

  1. >> fs=44100; 
  2. >> t=0:1/fs:0.03; 
  3. >> w=2*pi*220*t; 
  4. >> y1=cos(w); 
  5. >> plot(y1); 

 

 

 载波

第二步:

生成一个 22000 赫兹的高频调制信号。

  1. >> y2=cos(100*w); 
  2. >> plot(y2); 

 

 

 调制中

第三步:

把两个信号相乘并绘出图像。

  1. >> plot(y1.*y2); 

 

 

 调制后的信号

一个信号和一个标量相乘

一个函数和一个标量相乘的效果等于更改它的值域,在某些情况下,更改的是相标志。给定一个标量 K ,一个函数 F(t) 和这个标量相乘定义为:

  1. R(t) = K*F(t) 
  1. >> [y,fs]=audioread('cos440.ogg');        %creating the work files 
  2. >> res1='coslow.ogg';                 
  3. >> res2='coshigh.ogg';>> res3='cosinverted.ogg'
  4. >> K1=0.2;                                %values of the scalars 
  5. >> K2=0.5;>> K3=-1; 
  6. >> audiowrite(res1, K1*y, fs);            %product function-scalar 
  7. >> audiowrite(res2, K2*y, fs); 
  8. >> audiowrite(res3, K3*y, fs); 

原始信号的图像

  1. >> plot(y) 

信号振幅减为原始信号振幅的 0.2 倍后的图像

  1. >> plot(res1) 

 低余弦

信号振幅减为原始振幅的 0.5 倍后的图像

  1. >> plot(res2) 

 高余弦

倒相后的信号图像

  1. >> plot(res3) 

 倒相余弦

结论

基本数学运算比如代数和、乘,以及函数与常量相乘是更多高级运算比如谱分析、振幅调制,角调制等的支柱和基础。在下一个教程中,我们来看一看如何进行这样的运算以及它们对声音文件产生的效果。

责任编辑:庞桂玉 来源: Linux中国
相关推荐

2016-09-12 14:42:24

LinuxOctave音频文件

2016-10-31 20:21:05

LinuxOctave音频文件

2022-08-12 08:38:52

FFmpegLinux命令

2022-11-13 19:43:37

Linux

2023-01-05 16:51:04

机器学习人工智能

2019-09-10 10:44:29

物联网工业物联网智慧农业

2018-12-17 11:00:11

LinuxSoundConver音频文件格式

2020-05-15 08:06:37

JavaScriptobject URL对象

2022-04-12 11:07:11

Hi3861鸿蒙操作系统

2024-04-23 08:24:05

音频Android播放

2018-06-06 15:49:06

FPGA音频处理器

2023-11-28 14:22:54

Python音频

2011-08-01 14:42:47

iPhone 应用程序 声音

2009-10-21 10:15:29

VB.NET复制

2010-03-05 09:40:08

Python递归

2021-09-06 08:08:17

youtube-dl下载音频

2009-06-10 21:51:42

JavaScript XMLFirefox

2023-12-13 09:22:40

python

2010-03-01 14:02:26

Python批处理语言

2021-03-10 18:26:49

Tensorflow语音识别音频处理
点赞
收藏

51CTO技术栈公众号