วันเสาร์ที่ 1 กุมภาพันธ์ พ.ศ. 2557

VP8: Codec ใหม่เอี่ยมอ่องจาก Google

VP8: Codec ใหม่เอี่ยมอ่องจาก Google

หากเจ้าของลิขสิทธิ์รูปแบบวีดีโอ H.264 ทำได้สำเร็จจริงๆ YouTube ของ Google ก็อาจจะไม่ใช่ของฟรีอีกต่อไป เนื่องจากสิ่งที่เขาได้ออกมาเรียกร้องก็คือ ตั้งแต่ปี 2016 เป็นต้นไป ใครก็ตามที่นำวิดีโอ H.264 มาเผยแพร่บนหน้าเว็บไซต์จะต้องจ่ายเงินเป็นค่าลิขสิทธิ์ในการใช้งานวิดิโอรูปแบบ H.264 นี้ด้วย ซึ่งในที่นี้หมายความว่าเว็บไซต์ YouTube ที่มีแต่คลิปวิดีโอรูปแบบ H.264 จะต้องเสียเงินค่าลิขสิทธิ์เป็นจำนวนไม่น้อยเลย

นอกจากเว็บไซต์ Video Portal อย่างเช่น YouTube แล้ว ข้อเรียกร้องนี้ก็ยังมีผลกับโปรแกรมเว็บเบอร์เซอร์บางโปรแกรมด้วย ยกตัวอย่างเช่นในกรณีของโปรแกรม Firefox นั้นจะต้องมีตัวถอดรหัส H.264 ซึ่งจะต้องเสียเงินประมาณ 10 เซ็นต์สำหรับการโหลดแต่ละครั้ง ส่วนไมโครซอฟท์และแอปเปิลนั้นจะต่างออกไป เนื่องจากบริษัททั้งสองนี้ต่างก็มีสิทธิ์บัตรสำหรับ H.264 อยู่ถึง 69 รายการ ดังนั้นจึงสามารถที่ใช้แท็ก ใน HTML5 เล่นวิดีโอบนเว็บโดยตรงได้

ผลจากการเรียกร้องดังกล่าวนี้ทำให้ Google จำเป็นต้องมีมาตรการตอบโต้ โดยได้ทุ่มเงินจำนวนกว่า 100 ล้านเหรียญสหรัฐเข้าซื้อ On2 เมื่อช่วงต้นปีที่ผ่านมา แล้วนำเทคโนโลยีบีบอัดวิดีโอที่มีประสิทธิภาพสูงอย่าง VP8 มาใช้เป็น Open Source ที่ไม่ต้องเสียเงินเพื่อใช้เป็นคู่แข่งกับ H.264 โดยไฟล์วิดีโอ WebM ตามมาตรฐาน Google นอกจากจะมี VP8 เป็น Codec สำหรับภาพวิดีโอแล้วยังใช้ Vorbis ซึ่งเป็นคู่แข่งของ MP3 เป็น Codec สำหรับเสียง โดยในขณะนี้นอกเหนือไปจากโปรแกรม Chrome ของ Google เองแล้ว ไฟล์วิดีโอ WebM นี้ก็ยังได้ถูกนำไปติดตั้งใน Firefox และ Opera แล้วด้วย

อย่างไรก็ตามมาตรการตอบโต้นี้ก็อาจจะทำให้ Google ต้องเสียเงินจำนวนมหาศาลได้เหมือนกัน หากเจ้าของลิขสิทธิ์ H.264 ฟ้องร้องดำเนินคดี เพราะถึงแม้ว่าการพัฒนา VP8 ขึ้นมานั้นจะไม่ได้ใช้เทคโนโลยีในการบีบอัดวีดีโอใดๆ ของ H.264 โดยยอมลดคุณภาพของวีดีโอลง แต่โดยพื้นฐานแล้ว Codec สำหรับวิดีโอสมัยใหม่ทั้งหมดนั้น ก็ล้วนแล้วแต่ใช้เทคนิคที่เป็นแบบเดียวกันทั้งสิ้น

VP8 vs. H.264: ศึกชิงคุณภาพภาพ
เป็นที่รู้กันโดยทั่วไปว่า วิดีโอหนึ่งๆ นั้นจะประกอบไปด้วยภาพจำนวนหลายๆ ภาพประกอบรวมกัน ซึ่งในการที่จะบีบอัดภาพทั้งหมดให้ได้ดีที่สุดนั้น เพียงแค่การบันทึกภาพแต่ละภาพให้อยู่ในรูปแบบ JPEG อย่างเดียวนั้นยังไม่พอ แต่มันจะต้องมีกรรมวิธีและเทคนิคที่ซับซ้อนกว่านั้น เริ่มตั้งแต่การรวมภาพจำนวน 12-15 ภาพเข้าด้วยกันเป็น GOP (Groups of Pictures) ซึ่งในแต่ละ GOP นั้นจะมีแค่ภาพแรกเท่านั้นมีการบันทึกรายละเอียดต่างๆ ไว้เป็นภาพเต็ม (ภาพ I-Frame) โดยตัวเข้ารหัสจะมีการจัดการค่าความสว่างและค่าสีต่างๆ ทั้งหมดให้อยู่ในรูปแบบของ Macro Block ขนาด 16x16 ที่เป็นแบบเดียวกับภาพ JPEG จากนั้นจะแปลงค่าต่างๆ ของภาพเหล่านี้ให้เป็นความถี่ด้วยกระบวนการ DCT (Discrete Cosine Transformation) และตัดทอนค่าที่ไม่จำเป็นออกไปด้วยกรรมวิธีที่เรียกว่า Quantization

สำหรับภาพอื่นๆ ที่เหลือใน GOP นั้นจะแตกต่างไปจากภาพภาพแรกที่เป็นภาพเต็ม โดยมันจะภาพที่มีเฉพาะค่าความสว่างและค่าสีที่แตกต่างไปจากภาพที่อ้างอิงบันทึกอยู่ใน Macro Block เท่านั้น (ภาพ P-Frame) และเนื่องจากในกรณีส่วนใหญ่นั้น ในช่วงเสี้ยววินาทีหนึ่งๆ ซึ่งภาพแทบจะไม่มีการเปลี่ยนแปลงใดๆ เลย ดังนั้นในการตัดทอนค่าด้วยกรรมวิธี Quantization ของมันบางครั้งจึงแทบจะกลายเป็นศูนย์หรือไม่มีค่าใดๆ เหลืออยู่เลย



H.264 ได้มีการนำเทคนิคภาพ B-Frame มาใช้ประกอบเข้ากับภาพส่วนนี้ โดยมันสามารถอ้างอิงภาพในลำดับก่อนหน้าหรือภาพที่ตามมาในภายหลังได้จำนวนมากถึง 16 ภาพ ดังนั้นมันจึงช่วยทำให้ สามารถบีบอัดวิดีโอได้มากกว่าการที่มีเฉพาะภาพ P-Frame ซึ่งอ้างอิงภาพได้เฉพาะภาพก่อนหน้าเพียงแค่ภาพเดียวถึง 20 เปอร์เซ็นต์ แต่เนื่องจากเทคนิคภาพ B-Frame นี้ได้มีการจดลิขสิทธิ์ไว้และขณะนี้ก็ยังอยู่ในช่วงเวลาที่ได้รับการคุ้มครอง ดังนั้น VP8 จึงต้องจำกัดการบีบอัดภาพใน GOP ไว้เฉพาะแค่ภาพ P-Frame เท่านั้น แต่อย่างไรก็ตาม ในมาตรฐานใหม่นี้ก็มีการชดเชยด้วยภาพที่มีชื่อเรียกว่า Alternative Reference Frame ซึ่งมันจะไม่ได้ถูกแสดงขึ้นในระหว่างการเล่น แต่จะทำหน้าที่เป็นส่วนที่บันทึกข้อมูลสำหรับ Macro Block ที่ภาพ P-Frame ทั้งหลายของ GOP อ้างถึง แต่กระนั้นโดยภาพรวมแล้ว เทคนิคดังกล่าวนี้ก็ไม่สามารถทำหน้าที่ทดแทนการใช้ภาพ B-Frame ได้ร้อยเปอร์เซ็นต์อยู่ดี

ในการ Quantization เพื่อตัดทอนค่าที่ไม่จำเป็นนั้นตัวเข้ารหัสจะกำหนดระดับความแรงโดยใช้วิธี Coefficient อย่างเช่นในกรณีของตัวเข้ารหัส H.264 อย่าง x264 นั้นจะใช้ Coefficient เป็นเครื่องมือปรับแต่งความสมบูรณ์ของภาพที่ออกมา โดยจะปรับความแรงของ Macro Block ที่เป็นจุดดึงดูดสายตาให้ต่ำกว่าส่วนที่ไม่มีอะไรเกิดขึ้น ส่วน VP8 นั้นจะไม่สามารถใช้การปรับที่ลักษณะเชิงประยุกต์นี้ได้ เนื่องจากมันยังมีลิขสิทธิ์คุ้มครองอยู่ ดังนั้นในการปรับระดับเหล่านี้จึงจำเป็นต้องใช้การกำหนดค่า Coefficient ให้กับภาพแต่ละภาพตามวิธีการเดิมๆ

ตอนท้ายของกระบวนการการบีบอัด ตัวเข้ารหัส H.264 จะประเมินดูว่ามีส่วนของภาพที่มีความผิดปกติเกิดขึ้นกับภาพซึ่งเป็นผลมาจากการบีบอัดมากเกินไปหรือไม่ ซึ่งถ้ามี มันจะทำการคำนวณค่าสำหรับพื้นที่ส่วนนั้นออกไปใหม่โดยใช้เทคนิค Deblocking Filter นี้ ซึ่งใน H.264 นั้นมันสามารถปรับความแรงของ Deblocking ภายใน Macro Block ได้ ทำให้ไม่ต้องกังวลว่ารายละเอียดในภาพจะหายไป แต่ใน VP8 จะไม่สามารถใช้วิธีการแบบนี้ได้ เนื่องจากมันติดลิขสิทธิ์อยู่เช่นกัน ทำให้ต้องใช้อัตราข้อมูลที่ต่ำกว่า ซึ่งก็ส่งผลให้ความคมชัดของภาพตั้งต้องลดลงไปด้วย

ความเร็วและคุณภาพ: เปรียบเทียบ VP8 กับ Codec อื่น
แม้ลิขสิทธิ์ต่างๆ ของ H.264 จะเป็นอุปสรรคสำคัญที่คอยขัดขวางไม่ให้ VP8 สามารถที่จะแข่งขันกันในทางเทคนิคได้ แต่คุณภาพภาพที่ได้จาก Codec ตัวใหม่ของ Google นี้ก็ไม่ธรรมดาเหมือนกัน เพราะจากการทดสอบบีบอัดวิดีโอ 1080p ให้เป็น 720p ที่มีอัตราข้อมูล 3Mb/s ที่แม้ว่ามันจะไม่สามารถสู้ H.264 ที่เป็น High Profile ได้ แต่หากเป็น Baseline Profile ที่มักจะใช้กับวิดีโอในเว็บไซต์ทั้งหลายแล้ว คุณภาพของมันนั้นเรียกได้ว่า กินกันไม่ลงเหมือนกันและที่สำคัญนั้น มันดูดีกว่า Codec เก่าๆ อย่าง Xvid อย่างเห็นได้ชัดทีเดียว นอกจากนั้นการพัฒนา VP8 ตอนนี้ก็ยังเป็นแค่การเริ่มต้นด้วย ดังนั้นจึงมีความเป็นไปได้สูงที่มันจะมีประสิทธิภาพที่สูงขึ้นกว่านี้และในปัจจุบันนี้ Google ก็ได้เปิดสาขาวิจัยใหม่สำหรับเวอร์ชันต่อไปขึ้นมาแล้วด้วย ทำให้มั่นใจได้ว่า VP8 จะไม่หยุดอยู่เพียงเท่านี้อย่างแน่นอน และก็ไม่แน่ว่ามันอาจจะกลายมาเป็นรูปแบบมาตรฐานสำหรับวิดีโอบนเว็บไซต์ในอนาคตอันใกล้นี้ด้วยซ้ำ


*Peak Signal-to-Noise Ratio         **Structural Similarity

ข้อมูลเพิ่มเติมสำหรับเทคนิคการเข้ารหัสต่างๆ
ตามปกติแล้ว ลิขสิทธิ์เกี่ยวกับกรรมวิธีหรือเทคนิคต่างๆ ในสหรัฐอเมริกานั้น จะมีการคุ้มครองโดยมีระยะเวลาที่ยาวนานถึง 20 ปี และภายในมาตรฐานวิดีโอ H.264 ที่ถูกเผยแพร่ออกสู่สาธารณชนเมื่อปี 2001 ก็มีเทคนิคและกรรมวิธีต่างๆ ที่ได้รับการจดลิขสิทธิ์ไว้อยู่ถึง 1,300 รายการ ดังนั้นขณะนี้ Google จึงไม่สามารถนำเทคนิคใหม่ๆ ที่มีประสิทธิภาพสูงอย่างเช่นภาพ B-Frame มาใช้กับวิดีโอในรูปแบบ VP8 ของตัวเองได้เลย แต่จะใช้ได้เฉพาะเทคนิคเดิมๆ ที่ลิขสิทธิ์ของมันหมดอายุไปแล้วเท่านั้น

ไม่มีความคิดเห็น:

แสดงความคิดเห็น