"Tôi không thích người ta gọi tôi là 'Cha đẻ của MP3', Karlheinz Brandenburg nói. "Tất nhiên, tôi đúng là có tham gia từ lúc nghiên cứu cho đến khi nó xuất hiện trên thị trường". Brandenburg là một trong những người đã đặt tên cho định dạng nhạc số MP3 khi ông làm việc cho Hiệp hội Moving Picture Experts Group (MPEG). Nhân dịp MP3 đã bị dừng cấp giấy phép sử dụng bản quyền, cũng có nghĩa là những ngày cuối cùng của MP3 đã tới, chúng ta hãy cùng xem lại lịch sử một định dạng nhạc lừng danh đã gắn bó với tuổi thơ của rất nhiều, những công dân đầu tiên của kỉ nguyên số, và cũng là thứ giúp âm nhạc trở nên phổ biến như hiện nay trên Internet.
Những ngày đầu tiên: một luận án tiến sĩ
Vào đầu những năm 1970, Giáo sư Dieter Seitzer đến từ đại học Erlangen-Nuremberg ở Đức bắt đầu vật lộn với vấn đề truyền tải giọng nói qua đường điện thoại với chất lượng cao. Bản thân ông đã nộp một bằng sáng chế trước đó nhưng bị từ chối, nhưng ông vẫn tin rằng điều này có thể diễn ra nên ông tập hợp một nhóm sinh viên lại với nhau. Những người này cùng có hứng thú với việc tìm hiểu về giải thuật nén, giải nén âm thanh, và họ lấy nó làm chính luận văn tốt nghiệp hoặc luận văn tiến sĩ của mình.
Cuối năm 1970, với sự xuất hiện của chuẩn ISDN dùng để truyền tải âm thanh qua cáp quang dùng trong ngành viễn thông, việc cải thiện công nghệ giải nén giọng nói đã trở nên ít quan trọng hơn. Nhận thấy được điều này, nhóm của Giáo sư Seitzer chuyển hướng nghiên cứu, họ tập trung phát triển những giải thuật mới dùng cho tín hiệu âm nhạc.
Đến năm 1979, nhóm của Seitzer đã phát triển được một bộ vi xử lý đầu tiên có khả năng nén âm thanh. Trong quá trình làm ra linh kiện này, Karlheinz Brandenburg, thời đó còn là một sinh viên trong nhóm, đã bắt đầu áp dụng các nguyên lý tâm thính học (psychoacoustic) vào thuật toán mã hóa của nhóm. Nó mang vào dự án những tìm hiểu quan trọng trong việc tái tạo ra âm thanh mà tai người có thể nghe được và nghe giống với đời thực nhất có thể. Dưới sự hướng dẫn của vị giáo sư, Brandenburg và nhóm liên tục đạt được những bước tiến mới trong giải thuật mà họ đã miệt mà phát triển trong 9 năm ròng rã.
Những ngày đầu tiên: một luận án tiến sĩ
Vào đầu những năm 1970, Giáo sư Dieter Seitzer đến từ đại học Erlangen-Nuremberg ở Đức bắt đầu vật lộn với vấn đề truyền tải giọng nói qua đường điện thoại với chất lượng cao. Bản thân ông đã nộp một bằng sáng chế trước đó nhưng bị từ chối, nhưng ông vẫn tin rằng điều này có thể diễn ra nên ông tập hợp một nhóm sinh viên lại với nhau. Những người này cùng có hứng thú với việc tìm hiểu về giải thuật nén, giải nén âm thanh, và họ lấy nó làm chính luận văn tốt nghiệp hoặc luận văn tiến sĩ của mình.
Cuối năm 1970, với sự xuất hiện của chuẩn ISDN dùng để truyền tải âm thanh qua cáp quang dùng trong ngành viễn thông, việc cải thiện công nghệ giải nén giọng nói đã trở nên ít quan trọng hơn. Nhận thấy được điều này, nhóm của Giáo sư Seitzer chuyển hướng nghiên cứu, họ tập trung phát triển những giải thuật mới dùng cho tín hiệu âm nhạc.
Đến năm 1979, nhóm của Seitzer đã phát triển được một bộ vi xử lý đầu tiên có khả năng nén âm thanh. Trong quá trình làm ra linh kiện này, Karlheinz Brandenburg, thời đó còn là một sinh viên trong nhóm, đã bắt đầu áp dụng các nguyên lý tâm thính học (psychoacoustic) vào thuật toán mã hóa của nhóm. Nó mang vào dự án những tìm hiểu quan trọng trong việc tái tạo ra âm thanh mà tai người có thể nghe được và nghe giống với đời thực nhất có thể. Dưới sự hướng dẫn của vị giáo sư, Brandenburg và nhóm liên tục đạt được những bước tiến mới trong giải thuật mà họ đã miệt mà phát triển trong 9 năm ròng rã.
Đây là Karlheinz Brandenburg
Năm 1981, dĩa CD lần đầu tiên được công bố ra thế giới. Với mục đích lưu trữ dữ liệu âm thanh, CD sử dụng một định dạng không nén 16 bit / sample. Nhưng làm sao để có thể dễ dàng chuyển dữ liệu này qua các phương tiện khác hay chỉ đơn giản là truyền đi xa?
Brandenburg kể rằng ông vẫn tiếp tục làm việc với dự án mãi đến năm 1986. "Tôi luôn nói rằng những bước đi thật sự đầu tiên diễn ra vào năm 1986. Chúng ta có những chiếc máy tính tốt hơn, có cơ hội để thử nghiệm với nhạc trên máy tính. Thực ra thì vào đầu năm đó tôi đã thử nghĩ một số cách đi khác so với những người đang cùng nghiên cứu với tôi, và ý tưởng đó đã biến thành bản quyền đầu tiên cùng trong năm 1986. Ngày nay ý tưởng đó vẫn còn dùng cho MP3 và ISDN".
Năm 1987, một liên minh được thành lập giữa Đại học Erlangen-Nurember và Viện nghiên cứu Fraunhofer (Fraunhofer IIS). Họ nhận được sự tài trợ từ EU để nghiên cứu cách thức truyền âm thanh. Dưới sự dẫn dắt của Giáo sư Heinz Gerhäuser (đến từ IIS), nhóm nghiên cứu đã có thể tạo ra một thuật toán mã hóa âm thanh thời gian thực và có thể hoạt động được, gọi là LC-ATC. Trước đó LC-ATC chỉ xuất hiện ở dạng mô phỏng trên máy tính mà thôi vì cần rất nhiều sức mạnh xử lý, vậy nên người ta không thể dùng nó cho việc tối ưu trong môi trường thực tế.
Phần cứng cũng được nhóm của Heinz và Brandenburg làm ra, nó là một module kết hợp nhiều bộ xử lý tín hiệu số (Digital Signal Processor - DSP) với nhiều card âm thanh. Phần cứng này có thể nén và giải mã âm thanh, và cũng là một trong những phần cứng đầu tiên được thiết kế để dùng với định dạng nhạc nén.
Trở thành chuẩn chung của thế giới
Thời cơ dường như đến với nhóm nghiên cứu. Năm 1988, Tổ chức chuẩn hóa thế giới (ISO) kêu gọi tạo ra những chuẩn dành cho mã hóa âm mthanh. Nhóm nghiên cứu cho mục đích này được gọi là Moving Picture Experts Group, viết tắt là MPEG. Brandenburg nhắc tới một đồng nghiệp của mình tên là Leonardo Chiariglione, người đặt ra tầm nhìn rằng chuẩn này phải hữu dụng. Ý định ban đầu của Chiariglione là đem video lên đĩa CD.
"Đó là ứng dụng đầu tiên, nhưng trong danh sách mà chúng tôi liệt kê ra vẫn còn rất nhiều chỗ cần nén video và audio... Thế là chúng ta chia nhóm ra để nghiên cứu nhiều lớp khác nhau, mỗi lớp sẽ dùng cho một mục đích nhất định. Chúng tôi có Layer-I, có Layer-II, Layer-III... Hầu hết ý tưởng của chúng tôi được chuyển hóa thành thuật toán nén âm thanh MPEG, thứ phức tạp nhất và cũng là thứ mang lại chất lượng cao với bitrate thấp - đó chính là Layer-III."
Quảng cáo
Nhưng vẫn còn đó nhiều khó khăn, đặc biệt là trong việc tái tạo lại tiếng của ca sĩ. Họ sử dụng đĩa CD tên là "Solitude Standing" để làm đầu vào cho thuật toán. "Mọi thứ nghe khá ổn. nhưng giọng của ca sĩ Suzanne Vega đã bị hủy diện hoàn toàn". Thế là Brandenburg phải làm việc thêm với Jim Johnston của AT&T để xây dựng nên các mô hình thanh âm thanh và thuật toán mã hóa dữ liệu. Họ cố gắng cải thiện chất lượng của họ thống và giữ lại tiếng của Vega.
"Tôi nghĩ tôi đã nghe bài hát này khoảng 500 hay 1000 lần. Thực ra thì tôi vẫn thích nó đấy". Sau này tôi có dịp Suzanne Vega và tôi đã nghe cô ấy hát nhạc sống ngay trên sân khấu. "Thật xúc động, nghe giống hệt như trên đĩa CD. Tôi biết được chi tiết cô ấy hát như thế nào, và cô ấy vẫn đang hát ở đằng kia y hệt như thế".
Năm 1989, Brandenburg hoàn thành nghiên cứu tiến sĩ của mình về thuật toán mã hóa âm thanh và đây chính là nền tảng cơ bản cho MP3 về sau. Phần mềm để xử lý cho thuật toán này chủ yếu được phát triển bởi Bernhard Grill dưới sự dẫn dắt của Giáo sư Gerhäuser. Ở giai đoạn này, nhóm đã có thể nén video 64 kbit/s với chất lượng tốt lần đầu tiên trên thế giới. Với thành quả này, việc truyền âm thanh thời gian thực qua đường điện thoại là hoàn toàn có thể thực hiện, chứng minh cho niềm tin 19 năm về trước.
Năm 1991, MPEG nhận được tổng cộng 14 đề xuất về mã hóa âm thanh. Dưới sự khuyến khích của MPEG, những người tham gia đóng góp đã cùng nhau làm việc để tạo ra 4 đề xuất mới hơn. Sau nhiều tháng kiểm nghiệm, MPEG tách các phương thức mã hóa âm thanh ra làm 3 loại: Layer 1 dùng cho âm thanh không cần độ chi tiết cao, Layer 2 dùng cho phát thanh trên diện rộng, và Layer 3 là loại phức tạp nhất và có chất lượng cao nhất. Layer 3 là thuật toán mã hóa có hiệu quả cao nhất thời điểm đó và trở thành chìa khóa để truyền âm thanh qua đường điện thoại ISDN.
Năm 1992, MPEG "chốt" chuẩn mã hóa đầu tiên của mình: MPEG-1, chuyên dùng để nén video vào đĩa CD. Về âm thanh, Layer 3 trở thành cách lưu trữ nhạc trên HDD của những chiếc PC, và cũng là cách thức dùng để truyền tải file nhạc qua Internet thông qua kết nối Dial up 28.8kbps.
Quảng cáo
Nhưng mọi chuyện không dễ dàng như vậy. "Trong những ngày đầu tiên, hầu hết mọi người, nhất là những người của các công ty điện tử tiêu dùng lớn, nghĩ rằng Layer II sẽ tốt hơn vì Layer III quá phức tạp để có thể sử dụng. Vậy nên họ sử dụng Layer II trước".
Trong giai đoạn 1993 - 1994, phần cứng để giải mã MP3 bắt đầu xuất hiện. Nhóm MPEG cũng tìm nhiều cách khác nhau để quảng bá cho tiêu chuẩn mới của mình. Đât là một hành trình dài, vì họ cần kiếm đối tác, cho đối tác thấy được chất lượng của MP3, cũng như làm sao để người tiêu dùng có thể tiếp cận với chuẩn này một cách nhanh nhất và dễ dàng nhất.
Trong thời gian này, nhóm cũng định vị Internet sẽ là một ứng dụng quan trọng dành cho Layer III. "Chúng tôi cần một đuôi file - và chúng tôi chọn ngày 14-07-1995 làm ngày mà đuôi .mp3 ra đời." Đây sẽ là cái tên thương mại và phổ biến khi người ta nói về codec âm thanh MPEG Layer III. Cùng trong năm 1995, Viện Fraunhofer cung cấp phần mềm giải mã MP3 đầu tiên cho PC dưới dạng shareware. Bức thư viết về việc sử dụng đuôi MP3 nằm ngay bên dưới.
MP3 bước ra "trường đời"
Giai đoạn 1996 tới 1999 là giai đoạn MP3 dần trở nên phổ biến với mọi người. Những công ty phát hành nhạc, các dịch vụ nhạc online bắt đầu tiếp cận với định dạng này nhờ lợi thế chất lượng cao với dung lượng thấp. Năm 1997, trang web mp3.com ra đời như là một hub thông tin để mọi người biết về công nghệ này, những phần mềm nào tương thích để giải mã và chơi MP3, và mọi thứ liên quan. Không lâu sau đó, mp3.com trở thành trang chia sẻ nhạc hợp pháp lớn nhất thời bấy giờ.
Mọi thứ càng thú vị hơn khi vào khoảng năm 1998, các máy nghe nhạc MP3 bắt đầu xuất hiện rầm rộ. Hãng Saehan của Hàn Quốc ra mắt chiếc MPMAN, thiết bị chơi nhạc cầm tay đầu tiên sử dụng bộ nhớ đặc để phát các file MP3 tải về từ Internet hay được rip từ đĩa CD sang. Anh em còn nhớ những chiếc máy chơi MP3 bé bé nhỏ nhỏ mà chúng ta từng thấy hồi còn bé chứ? MPMAN chính là khởi điểm của một hành trình vui vẻ sau này.
Năm 2000, những thiết bị MP3 đầu tiên bắt đầu bán ra ở Mỹ, cũng có vài model hỗ trợ cả CD lẫn MP3. MP3 nhanh chóng trở thành một xu hướng văn hóa mới với hàng triệu, trăm triệu thiết bị có khả năng chơi MP3 được bán ra mỗi năm.
Năm 2004, Viện Fraunhofer ra mắt cấu hình mới hơn là MP3 surround, một bản nâng cấp của MP3 hỗ trợ âm thanh 5.1. Bitrate của MP3 surround tính ra cũng ngang ngửa với MP3 stereo mà thôi. Cái hay đó là MP3 surround tương thích với mọi thiết bị MP3 đang bán ra nên không tạo một cú "nấc cục" cho sự phát triển của chuẩn mã hóa này.
Tính đến năm 2006, nhờ có MP3 mà hơn 10.000 đầu việc đã được tạo ra, mang về cho Đức khoảng 300 triệu Euro tiền thuế mỗi năm. Bản thân nước Đức chi 1,5 tỉ Euro cho các máy phát MP3 và những sản phẩm có liên quan tới MP3 nói chung.
Trong giai đoạn này, MP3 cũng thật sự đánh thức tình yêu âm nhạc của hàng triệu người khi họ có thể dễ dàng thưởng thức bài hát yêu thích mọi lúc mọi nơi, trong những thiết bị chứa được cả trăm, cả nghìn bài hát. Bạn không cần phải mỏi mắt đi tìm đúng cái đĩa CD chứa một bài nhạc mà bạn đã chưa nghe nhiều năm. Chỉ vài thao tác search là file MP3 đã hiện ra. Các máy chơi nhạc 40GB có thể chứa cả 10.000 bài hát, dư sức thu gọn cả bộ sưu tập đĩa nhạc của bạn vào trong một cái máy bé tí hon.
MP3 không chỉ là một công nghệ, nó còn là một cầu nối giữa những người yêu âm nhạc với nghệ sĩ, giữa người hát và người nghe, giữa những người làm nhạc và khán thính giả của họ.
Năm 2009, Technicolor giới thiệu một chuẩn mới hơn nữa sau việc hợp tác với Viện Fraunhofer: mp3HD, giải pháp cho nén audio lossless. MP3 HD tương thích với tất cả thiết bị MP3, lại một lần nữa rất đáng khen.
Sự xuất hiện của AAC
Tất nhiên, người ta không bao giờ hài lòng với hiện tại. Khi mà MP3 vẫn đang bùng nổ thì chính Hiệp hội MPEG cũng nghiên cứu một thứ mới hơn, xịn hơn để thay thế cho MP3, và đó là AAC (năm 1997). AAC đã được ISO chuẩn hóa và nó sử dụng 2 loại cấu hình: MPEG-2 và MPEG-4. AAC hỗ trợ âm thanh 48 kênh full bandwidth, hỗ trợ cả stereo lẫn các hệ thống âm thanh nhiều kênh, đồng thời có khả năng nén tốt hơn MP3 trong khi chất lượng lại cao hơn. Nói cách khác, cùng một bài hát khi nén thành file nhạc AAC sẽ có dung lượng thấp hơn và nghe hay hơn so với nén thành file MP3.
AAC hiện đang là chuẩn audio dùng cho YouTube, iPhone, iPod, iPad, các máy chơi game Nintendo, iTunes, PlayStation, Android, BlackBerry. Ngày nay tất cả những thiết bị điện tử hiện đại, kể cả hệ thống giải trí trong xe hơi, cũng đã hỗ trợ cho AAC.
Nếu như MP3 chỉ phổ biến với đuôi .mp3 thì MP4 có nhiều hơn: m4a, mp4, 3gp, m4b, m4p, m4v, m4r (4 cái cuối là của riêng Apple). Video AAC cũng là thứ dùng cho các file video *.mp4.
AAC chính là thứ mà hiệp hội MPEG muốn mọi người sử dụng khi ngày khai tử MP3 đã gần kề. Ví dụ, iTunes đã sử dụng AAC làm định dạng nhạc cho các file họ bán ngay từ buổi đầu tiên. Chia tay MP3 cũng tiếc, nhưng với sự phổ biến của MP3 hiện tại thì vẫn còn khá lâu nữa định dạng nhạc này mới biến mất khỏi thị trường. Có lẽ cần thêm 2-3 năm nữa thì MP3 mới bắt đầu chậm lại, và đâu đó trong 5 năm nó sẽ không còn là chuẩn được sử dụng phổ biến nữa. Tạm biệt MP3!
Tham khảo: MP3 History, NPR