Định dạng nhạc số phổ biến

Bạn có biết WAV, FLAC và MP3 khác nhau như thế nào không? Giữa thời đại bùng nổ của nhạc số, nhưng không phải ai cũng trả lời được câu hỏi này!

Trong thời đại nhạc số lên ngôi, người ta luôn cố gắng sáng tạo ra các định dạng âm thanh khác nhau, với mục đích giảm thiểu dung lượng của file nhạc lưu trữ nhưng vẫn phải giữ được chất lượng âm thanh hoàn hảo. Về cơ bản, mỗi định dạng âm thanh sẽ sử dụng các thuật toán khác nhau để lấy mẫu, mã hóa cũng như giữ lại đặc trưng của file nhạc gốc.

nhac-soCâu hỏi đặt ra là giữa vô vàn định dạng nhạc số hiện nay, từ MP3, WMA, AAC cho đến FLAC, ALAC, APE hay WAV,AIFF – chất lượng chúng khác nhau ra sao, chúng ta nghe nên loại nào, lưu trữ định dạng nào? Hãy cùng “giải ngố”!

 Chơi đồ gì, nghe nhạc gì ?
Chơi đồ gì, nghe nhạc gì ?

Trước hết, chúng ta sẽ cần tìm hiểu những yếu tố căn bản của định dạng âm thanh với khái niệm PCM (Pulse-Code Modulation). Ra đời năm 1937, PCM là một trong những công nghệ đầu tiên hỗ trợ chuyển tín hiệu sóng âm (analog) thành kĩ thuật số (digital). Nôm na là nhờ PCM, chúng ta mới có thể nghe nhạc trên máy tính, đầu đĩa CD thay vì đĩa than, vinyl hay băng cát sét như các bậc cha ông trước đây.

PCM được đặc trưng bởi hai thành phần:

+ Tần số mẫu (sample rate): cho biết số lần tín hiệu âm thanh được đo và lấy mẫu trong một giây.

+ Độ dày bit (bit-depth): Hiểu một cách đơn giản, bit là những mã nhị phân (số 0 và số 1) dùng để tạo ra dữ liệu – hay những file nhạc mà chúng ta tải về. Đối với âm thanh kĩ thuật số (digital audio), bit-depth sẽ cho biết số lượng các bit được sử dụng để lưu trữ tín hiệu âm thanh.

Trên cả lý thuyết lẫn thực tế, âm thanh có độ phân giải cao sẽ chi tiết hơn âm thanh có độ phân giải thấp. Tuy nhiên, nó còn phụ thuộc vào rất nhiều yếu tố khác như chất lượng thu âm, hệ thống âm thanh (đặc biệt là DAC – Digital to Analog Converter) và quan trọng nhất là thính giác con người – đã là “tai trâu” thì nghe mp3 với lossless cũng như nhau mà thôi.

Trước đây, nhạc số thường được ghi lại trên đĩa CD 16-bit với tần số 44.1 kHz. Tuy nhiên với sự phát triển nhanh chóng của công nghệ âm thanh, những bản ghi âm với độ phân giải lên tới 24-bit, 32-bit cùng sample rate 96khz và thậm chí là 192khz xuất hiện ngày càng phổ biến.

Về bản chất, các loại định dạng âm thanh phổ biến trên thế giới sẽ được chia thành 3 nhóm: không nén (uncompressed), nén nhưng bảo toàn dữ liệu (lossless) và nén không bảo toàn dữ liệu (lossy).

Không nén (uncompressed): WAV, AIFF

Đúng như tên gọi, loại định dạng âm thanh này là nguyên bản, không bị nén và có dung lượng khá lớn như WAV, AIFF. Theo chuẩn định dạng này, cứ mỗi giây, âm thanh sẽ được lẫy mẫu với tần số 44.1 KHz (44100 lần/giây), mỗi mẫu được diễn tả bởi 16 bit dữ liệu. Vậy với 1 phút âm thanh, ta có:

44100 Hz x 2 kênh trái phải x 2 bytes (16 bit = 2 bytes) x 60 giây = 10.584.000 bytes = 10.1 MB.

Điều này giải thích tại sao, thông thường 1 đĩa CD có dung lượng 750 MB sẽ lưu được khoảng 74 phút nhạc, tương ứng bit rate chuẩn của âm thanh gốc là 44100 Hz X 2 kênh X 16bit = 1411 kbps (Kilobits/second)

 File nhạc định dạng WAV với bit-rate chuẩn 1411 kpbs
File nhạc định dạng WAV với bit-rate chuẩn 1411 kpbs

WAV

WAV là dạng file âm thanh không nén dựa trên định dạng PCM, được phát triển bởi Microsoft và IBM vào năm 1991 để giúp người dùng sử dụng dễ dàng hơn trên các máy Windows. Tuy nhiên ở thời điểm hiện tại WAV đã trở nên phổ biến trên cả Mac và Windows.

AIFF

Giống như WAV, AIFF cũng dựa trên công nghệ PCM, nhưng được phát triển bởi Apple cho các máy Mac của mình. Ngoài ra AIFF còn có các phiên bản khác là AIFF-C và Apple Loops, được sử dụng bởi các phần mềm làm nhạc GarageBand và Logic Pro. Tuy được thiết kế cho Mac, các máy Windows vẫn có thể sử dụng định dạng này một cách bình thường.

Nén không mất dữ liệu (Lossless Compression): FLAC, APE, ALAC

Nếu dùng máy tính, bạn sẽ không xa lạ gì với Zip hay Rar – 2 phần mềm có khả năng giảm thiểu dung lượng file một cách đáng kể, nhưng dữ liệu của nó thì vẫn y nguyên. Đó cũng là mục đích của công việc nén không mất dữ liệu (lossess compression): giữ nguyên tín hiệu của âm thanh gốc.

Làm điều đó như thế nào? Đơn giản, nó sử dụng thuật toán để tìm ra quy luật lặp của dữ liệu, sau đó tìm 1 cách hiển thị khác tối ưu hơn, tốn ít dữ liệu hơn. Ví dụ thay vì chuỗi “ggggg eeee nnn kkkkkkk“, chúng ta có cách diễn giải tốt mà ít chữ hơn nhiều: “gx5 ex4 nx3 kx7”.

Như vậy, thuật toán nén không mất dữ liệu sẽ đảm bảo chất lượng ban đầu sau khi giải nén, vì nó không lược bỏ đi bất kể cái gì, nó chỉ tìm cách hiển thị dữ liệu khác mà thôi.

 Định dạng Flac (nhạc lossless) đã bị nén - bit-rate giảm xuống 1041kbps - dung lượng cũng nhẹ hơn
Định dạng Flac (nhạc lossless) đã bị nén – bit-rate giảm xuống 1041kbps – dung lượng cũng nhẹ hơn

Trên thực tế, dữ liệu âm thanh trong 1 bản thu cực kỳ đa dạng và sử dụng nhiều dữ liệu nên việc nén không có hiệu quả tối đa như Zip hay Rar đâu. Hiện tại, độ nén cao nhất có thể của kỹ thuật lossless compression là bằng khoảng 1/3 => 1/2 dung lượng gốc của âm thanh gốc, mỗi album lossless sẽ có dung lượng khoảng 200 đến 300 Mb.

FLAC(Free Lossless Audio Codec), ALAC( Apple Lossless Audio Codec) và APE( Monkey’s Audio) là 3 định dạng lossless thông dụng hiện nay. Trong số đó, FLAC được ưa chuộng nhất và hỗ trợ chơi trên khá nhiều máy nghe nhạc, APE giải mã phức tạp hơn còn ALAC của Apple thì không phổ biến bằng 2 định dạng còn lại.

Nén không bảo toàn dữ liệu (Lossy): MP3, AAC, WMA, Vorbis,…

Ở cái thời Internet chậm như rùa bò, giá ổ cứng thì đắt đỏ, việc download hay lưu trữ một đĩa nhạc CD với dung lượng hơn 700 MB tốn rất nhiều và thời gian, công sức. Đó là lý do tại sao những định dạng “nén mất dữ liệu” (lossy) ra đời, bằng cách hi sinh chất lượng và độ chính xác của âm thanh để giảm nhẹ dung lượng file nhạc.

Ngoài ra, tai con người cũng chỉ có khả năng cảm nhận những âm thanh có tần số nằm trong khoảng 16Hz – 20KHz, tần số ở ngoài dải âm này sẽ bị thuận toán nén loại bỏ. Việc này vừa tiết kiệm được số lần lấy mẫu cũng như số bit để mã hóa, từ đó tiết kiệm được dung lượng tối đa.

Trên thực tế, nhạc mp3 thường được nén với bit-rate là 128kbps cho tới 320kbps – chỉ bằng 1/10 so với bit-rate của WAV (1411kbps). Dễ hiểu tại sao, mỗi phút nhạc mp3 128kbps chỉ tốn khoảng 1MB và một chiếc đĩa CD có thể lưu tới hàng trăm bài hát.

 Định dạng nhạc mp3 đã mở ra thời hoàng kim cho máy nghe nhạc Sony
Định dạng nhạc mp3 đã mở ra thời hoàng kim cho máy nghe nhạc Sony

Vậy cái giá của việc tiết kiệm dung lượng là gì? Trong quá trình nén, những âm thanh giả sẽ được “bù đắp” vào những phần mà nó loại bỏ đi, dẫn đến hiện tượng méo âm so với âm thanh gốc. Bạn cứ thử so sánh 1 bản mp3 64kbps với 1 file nén lossless hoặc 1 track trong CD gốc và dễ dàng nhận ra sự thay đổi này.

Ngoài ra, khi đã nén sang định dạng lossy, chúng ta không thể chuyển đổi nó lại chất lượng như ban đầu như lossless. Nôm na là WAV có thể convert sang FLAC và ngược lại mà vẫn giữ nguyên chất lượng âm thanh, còn WAV sang mp3 128 kbps thì vĩnh viễn mất đi chất lượng của file gốc.

Tuy vậy, những định dạng lossy như MP3, AAC, WMA, Vorbis vẫn được sử dụng phổ biến hiện nay vì tính gọn nhẹ của nó. Nếu không qúa khó tính trong việc thẩm âm hoặc đơn giản là nghe Pop, Rock, Dance (chứ không phải là nhạc cổ điển, vocal với các tần số âm thanh cao, nhạc cụ nhiều) thì định dạng lossy hoàn toàn có thể đáp ứng được nhu cầu của bạn.

Như vậy, đến đây bạn đã có thể phân biệt được nguồn gốc và sự khác nhau của WAV, FLAC và MP3 – những định dạng nhạc số phổ biến hiện nay rồi. Việc nghe loại nào, lưu trữ loại nào sẽ phụ thuộc vào 3 yếu tố chính:

  • Bạn muốn chất lượng âm thanh như thế nào?
  • Khả năng thẩm âm của bạn tốt đến đâu?
  • Thiết bị âm thanh (loa, đài, DAC/AMP, headphone,…) của bạn có khả năng đến đâu?

Cá nhân tôi thì nghĩ rằng, khi bắt đầu tìm tòi, download những bản nhạc lossless hay hi-res chất lượng cao – nghĩa là nhu cầu thưởng thức âm nhạc của bạn đã thực sự thay đổi. Chẳng sớm thì muộn, bạn cũng sẽ bước chân vào con đường “sướng cái tai, khổ cái ví” này.

Tổng hợp