Google: Thế giới đã có hơn 1 ngàn tỷ địa chỉ URL
Bên cạnh việc thông báo con số ấn tượng này, Google cũng đã tận dụng cơ hội để "khoe" về quy mô cũng tầm quan trọng của cơ sở dữ liệu chỉ mục nổi tiếng của hãng.
Ngày hôm qua, 25/7, trên blog chính thức của hãng, Google cho biết số lượng địa chỉ URL trên mạng Internet toàn cầu đã vượt con số 1 ngàn tỷ.
Bên cạnh việc thông báo con số ấn tượng này, Google cũng đã tận dụng cơ hội để "khoe" về quy mô cũng tầm quan trọng của cơ sở dữ liệu chỉ mục nổi tiếng của hãng.
"Chúng tôi không đánh chỉ mục tất cả 1 ngàn tỷ trang web này - có rất nhiều trang web trong số chúng có nội dung giống nhau, hoặc là những nội dung được tự động sinh ra từ một trang web khác... Đó là những điều rất bất lợi cho những người tìm kiếm. Tuy nhiên, chúng tôi tự hào là có một hệ thống đánh chỉ mục hiệu quả bậc nhất so với các công cụ tìm kiếm khác. Mục tiêu của chúng tôi là đánh chỉ mục cho tất cả các dữ liệu tồn tại trên thế giới này" - Jesse Albert và Nissan Hajaj, 2 kỹ sư phần mềm của nhóm Cơ sở hạ tầng tìm kiếm Web của Google, phát biểu.
Đây là một trong những lần hiếm hoi Google chính thức công bố về quy mô cơ sở dữ liệu chỉ mục của hãng - một trong những chủ đề gây tranh cãi nhiều nhất trong lĩnh vực tìm kiếm suốt nhiều năm qua.
Mặc dù vậy, có một thực tế là phần lớn người dùng thường không lướt qua quá 2 trang kết quả tìm kiếm. Nói cách khác là họ chỉ thực sự tìm kiếm trong 10 10 đến 20 đường link đầu tiên của trang kết quả, thậm chí, có không ít người hài lòng với thông tin mình có được chỉ sau một cú kích chuột vào một đường link duy nhất. Rất hiếm người có đủ kiên nhẫn mà xem khoảng 5.000 kết quả để tìm được thông tin mình mong muốn.
Cũng trong bài viết này, Google đã tiết lộ một thông tin thú vị khác về mức độ phân tích các đường link này của hãng.
"Ngày nay, Google liên tục download, thu thập thông tin được cập nhật trên các trang web và xử lý toàn bộ đồ thị weblink nhiều lần trong một ngày. Đồ thị của 1 ngàn tỷ địa chỉ URL cũng tương tự như bản đồ được tạo ra từ một ngàn tỷ giao lộ. Chính vì thế, nhiều lần trong một ngày chúng tôi phải thực hiện những xử lý tương tự như việc khám phá tất cả các giao lộ xuất hiện trên tất cả các con đường ở Mỹ. Chỉ có một điều, chiếc bản đồ của chúng tôi lớn gấp 50.000 lần nước Mỹ và số con đường và giao lộ cũng gấp tới 50.000 lần như vậy" - Google phát biểu.
URL (Uniform Resource Locator) là một dãy các ký tự được sử dụng để đại diện cho một nguồn thông tin tồn tại trên Internet.
Mỗi một URL thường bắt đầu với phần giao thức - nó cho biết giao thức được sử dụng, và phần thứ 2 là tên nguồn - nó cho biết địa chỉ IP hay tên miền cụ thể nơi nguồn thông tin được đặt.
Đăng nhận xét