Tìm kiếm nhị phân(binary search)

Tìm kiếm nhị phân(binary search) là một thuật toán tìm kiếm xác định vị trí của một giá trị cần tìm trong một mảng đã được sắp xếp. Thuật toán sẽ tiến hành so sánh giá trị cần tìm với phần tử đứng giữa của mảng. Nếu hai giá trị không bằng nhau, thì một

Tìm kiếm nhị phân(binary search) là một thuật toán tìm kiếm xác định vị trí của một giá trị cần tìm trong một mảng đã được sắp xếp.

Thuật toán sẽ tiến hành so sánh giá trị cần tìm với phần tử đứng giữa của mảng. Nếu hai giá trị không bằng nhau, thì một nửa mảng không chứa giá trị cần tìm sẽ được bỏ qua, và tiếp tục tìm kiếm trên nửa còn lại. Một lần nữa, lấy phần tử ở giữa so sánh với giá trị cần tìm, cứ thế lặp lại cho đến khi tìm thấy giá trị đó. Nếu phép tìm kiếm kết thúc mà vẫn chưa có giá trị cần tìm tức là nó không có trong mảng.

Binary search chạy theo giời gian logarit trong trường hợp tệ nhất, thực hiện O(logn) bước so sánh, với n là số phần tử của mảng. Thuật toán này sẽ nhanh hơn thuật toán tìm kiếm tuyến tính thông thường(lặp qua toàn mảng) là O(n)


Một số vấn đề thường gặp/cần suy nghĩ khi giải bài toán binary search:

– Khi nào thì sẽ thoát ra khỏi vòng lặp?

Nên dùng left < right hay left ≤ right làm điều kiện lặp

– Làm sao để khởi tạo và cập nhật biên bên trái(left), biên bên phải(right)?

Nên chọn left = mid hay left = mid + 1 hay right = mid, right = mid – 1?

Vì thế, một bản mẫu tổng quát về cách giải binary search sẽ giúp bạn hình dung về cách giải bài toán này dễ dàng hơn.

Cách giải tổng quát

Đề bài: Giả sử có một không gian tìm kiếm, có thể là một mảng, một phạm vi, … Thông thường, nó được sắp xếp theo thứ tự tăng dần.

Tìm k thỏa điều kiện với condition sao cho tối ưu nhất:

Minimize k, s.t. condition(k) is True

Cách giải tổng quát:

defbinary_search(array)->int:defcondition(value)->bool:pass
	
left, right =0,len(array)while left < right:
    mid = left +(right + left)//2if condition(mid):
	right = mid
    else:
	left = mid +1return left

Đối với từng đề bài, bạn chỉ cẩn sửa đổi 3 phần sau:

  1. Khởi tạo biên left, right sao cho bao gồm tất cả các phần tử có thể

  2. Quyết định giá trị trả về

  3. Thiết kế điều kiện kiểm tra(condition) – đây chính là phần thú vị nhất và cũng là khó nhất.

Vì sao mid = left + (right – left) // 2 mà không là (left + right) // 2

Lúc xem template này mình đã có câu hỏi như vậy. Chỉ là lấy số ở giữa, thì cộng hai bên chia đôi lấy nguyên tức là mid = (left + right) // 2 chứ sao lại có công thức mid = left + (right – left) // 2 ?

Khi mid = (left + right) // 2, với left, right là các số rất lớn, gần bằng 2^31 – 1 chẳng hạn, thì tổng của left + right sẽ lớn hơn 2^31 – 1(số nguyên lớn nhất) và gây tràn số.

Có nhiều cách giải quyết vấn đề này, một trong số đó là left + (right – left) // 2

Bạn có thể đọc thêm ở đây

Bài toán: First Bad Version

LeetCode link First Bad Version.

You are a product manager and currently leading a team to develop a new product. Since each version is developed based on the previous version, all the versions after a bad version are also bad. Suppose you have n versions [1, 2, …, n] and you want to find out the first bad one, which causes all the following ones to be bad. You are given an API bool isBadVersion(version) which will return whether version is bad.

Example:

Given n =5,and version =4is the first bad version.

call isBadVersion(3)-> false
call isBadVersion(5)-> true
call isBadVersion(4)-> true

Then 4is the first bad version.

Giải:

Không gian tìm kiểm ở đây là từ 1 đến n, sắp xếp theo thứ tự version này release rồi mới đến version khác.

Vì nếu version nào fail sẽ dẫn đến tất cả những version tiếp theo fail, nên biên của right sẽ thu hẹp dần về left cho đến khi nào tìm được version fail đầu tiên thì thôi.

Áp dụng công thức ở trên vào bài toán này:

  1. left bắt đầu từ 0, right bắt đầu từ n

  2. giá trị trả về sẽ là left

  3. điều kiện được cho sẵn là hàm isBadVersion() nên sẽ không cần định nghĩa điều kiện.

deffirstBadVersion(self, n):
    left, right =1, n

    while left < right:

        mid = left +(right - left)//2if isBadVersion(mid):
            right = mid
        else:
            left = mid +1return left

Bài toán: sqrt(x)

LeetCodeLinkSqrtX

Cho một số nguyên x, tìm căn bậc hai của x.

Example 1: Input: x = 4. Output: 2

Giải:

Gọi căn bậc hai của x là k, ta có: x = k * k. Bài toán đưa về tìm số k sao cho k bình phương là x.

Phạm vi tìm kiếm sẽ là từ 0 tới x, điều kiện là k * k bằng hoặc gần bằng x nhất

defmySqrt(self, x):if x ==0:return0if x ==1:return1

    left, right =0, x

    while left < right:
        mid = left +(right - left)//2ifround(mid * mid,2)<= x:
            left = mid +1else:
            right = mid
        
        return left -1

Thêm các bài toán khó hơn nữa mời bạn ghé đọc bài viết của tác giả đóng góp trên LeetCode ở đây nhé

Bài viết gốc nằm ở blog cá nhân của mình, mời các bạn ghé chơi nhé.

Nguồn: viblo.asia

Bài viết liên quan

WebP là gì? Hướng dẫn cách để chuyển hình ảnh jpg, png qua webp

WebP là gì? WebP là một định dạng ảnh hiện đại, được phát triển bởi Google

Điểm khác biệt giữa IPv4 và IPv6 là gì?

IPv4 và IPv6 là hai phiên bản của hệ thống địa chỉ Giao thức Internet (IP). IP l

Check nameservers của tên miền xem website trỏ đúng chưa

Tìm hiểu cách check nameservers của tên miền để xác định tên miền đó đang dùn

Mình đang dùng Google Domains để check tên miền hàng ngày

Từ khi thông báo dịch vụ Google Domains bỏ mác Beta, mình mới để ý và bắt đầ