Cluster là gì? Tất cả các điều cần biết về Cluster
Nhiều nút máy tính hoặc máy chủ hoạt động cùng nhau để hỗ trợ một ứng dụng hoặc phần mềm trung gian như cơ sở dữ liệu.
Nội dung
Cluster là gì?
Cluster hay cụm là một nhóm các máy tính hoặc máy chủ được kết nối với nhau hoạt động cùng nhau để hỗ trợ các ứng dụng và phần mềm trung gian (ví dụ: cơ sở dữ liệu).
Trong một cụm, mỗi máy tính được gọi là một “nút”. Không giống như các máy tính dạng lưới, trong đó mỗi nút thực hiện một nhiệm vụ khác nhau, các cụm máy tính sẽ gán cùng một nhiệm vụ cho mỗi nút. Các nút trong một cụm thường được kết nối với nhau thông qua mạng cục bộ tốc độ cao. Mỗi nút chạy phiên bản hệ điều hành riêng của nó. Một cụm máy tính có thể bao gồm từ một hệ thống hai nút đơn giản kết nối hai máy tính cá nhân đến một siêu máy tính có kiến trúc cụm.
Các cụm máy tính thường được sử dụng để tính toán hiệu suất cao (HPC) và tính sẵn sàng cao (HA) hiệu quả về chi phí. Nếu một thành phần đơn lẻ bị lỗi trong một cụm máy tính, các nút khác sẽ tiếp tục cung cấp quá trình xử lý không bị gián đoạn. Một cụm máy tính có thể cung cấp tốc độ xử lý nhanh hơn, dung lượng lưu trữ lớn hơn, tính toàn vẹn của dữ liệu tốt hơn, độ tin cậy cao hơn và khả năng cung cấp tài nguyên rộng rãi hơn. Các cụm máy tính thường dành riêng cho các chức năng cụ thể, chẳng hạn như cân bằng tải, tính sẵn sàng cao, hiệu suất cao hoặc xử lý quy mô lớn.
Các loại cụm Cluster
- Các cụm dự phòng bao gồm 2 hoặc nhiều máy tính được kết nối mạng với kết nối nhịp tim riêng biệt giữa 2 máy chủ. Kết nối Heartbeat giữa hai máy đang được sử dụng để theo dõi xem tất cả các dịch vụ có còn được sử dụng hay không: ngay khi một dịch vụ trên một máy bị hỏng, các máy khác sẽ cố gắng tiếp nhận.
- Với các cụm cân bằng tải, khái niệm là khi một yêu cầu nói rằng một máy chủ web đến, cụm sẽ kiểm tra máy nào ít bận nhất và sau đó gửi yêu cầu đến máy đó. Cụm cân bằng tải thường cũng là một cụm Fail-over nhưng có thêm chức năng cân bằng tải và thường có nhiều nút hơn.
- Cụm máy tính hiệu suất cao: các máy đang được cấu hình đặc biệt để cung cấp cho các trung tâm dữ liệu yêu cầu hiệu suất cực cao những gì chúng cần. Các loại cụm này cũng có một số tính năng cân bằng tải; họ cố gắng phổ biến các quy trình khác nhau cho nhiều máy hơn để đạt được hiệu suất. Nhưng điều phân biệt tình huống này là một quá trình đang được chạy song song và các quy trình có thể chạy riêng biệt sẽ được trải rộng trên các máy khác nhau thay vì phải đợi cho đến khi chúng hoàn thành lần lượt.
Các ví dụ phổ biến nhất của cụm cân bằng tải và chuyển đổi dự phòng là webfarms, cơ sở dữ liệu hoặc tường lửa.
>>> Cân bằng tải là gì và tại sao phải dùng cân bằng tải?
4 lợi ích chính của tính toán cụm
Tính toán cụm cung cấp một số lợi ích: tính sẵn sàng cao thông qua khả năng chịu lỗi và khả năng phục hồi, khả năng cân bằng tải và mở rộng, cũng như cải thiện hiệu suất. Hãy mở rộng từng tính năng này và kiểm tra cách các cụm kích hoạt chúng.
1. Tính sẵn sàng cao
Có một số thuật ngữ quan trọng cần nhớ khi thảo luận về tính mạnh mẽ của một hệ thống:
- Tính khả dụng – khả năng truy cập của hệ thống hoặc dịch vụ trong một khoảng thời gian, thường được biểu thị bằng phần trăm thời gian hoạt động trong một năm nhất định (ví dụ: tính khả dụng 99,999% hoặc năm 9)
- Khả năng phục hồi – hệ thống phục hồi tốt như thế nào sau khi thất bại
- Khả năng chịu lỗi – khả năng hệ thống tiếp tục cung cấp dịch vụ trong trường hợp bị lỗi
- Độ tin cậy – xác suất mà một hệ thống sẽ hoạt động như mong đợi
- Dự phòng – nhân bản các tài nguyên quan trọng để cải thiện độ tin cậy của hệ thống
Một ứng dụng chạy trên một máy có một điểm lỗi duy nhất, điều này làm cho độ tin cậy của hệ thống kém. Nếu máy lưu trữ ứng dụng gặp sự cố, hầu như sẽ luôn có thời gian chết trong khi cơ sở hạ tầng phục hồi. Duy trì mức độ dự phòng, giúp cải thiện độ tin cậy, có thể giảm thời gian ứng dụng không khả dụng. Điều này có thể đạt được bằng cách chạy trước ứng dụng trên hệ thống thứ hai (có thể có hoặc có thể không nhận được lưu lượng truy cập) hoặc có một hệ thống lạnh (như trong, hiện không chạy) được cấu hình sẵn với ứng dụng. Các cấu hình này lần lượt được gọi là cấu hình chủ động-tích cực và chủ động-thụ động . Khi một lỗi được phát hiện, một hoạt động tích cực hệ thống có thể chuyển đổi dự phòng ngay lập tức sang máy thứ hai, trong khi hệ thống chủ động-thụ động sẽ bị lỗi sau khi máy thứ hai hoạt động.
Các cụm máy tính bao gồm nhiều hơn một nút chạy cùng một quá trình đồng thời và do đó là các hệ thống hoạt động tích cực . Các hệ thống hoạt động tích cực thường có khả năng chịu lỗi vì hệ thống này vốn được thiết kế để xử lý việc mất một nút. Nếu một nút bị lỗi, (các) nút còn lại sẵn sàng tiếp nhận khối lượng công việc của nút bị lỗi. Như đã nói, một cụm yêu cầu nút lãnh đạo phải chạy tối thiểu hai nút lãnh đạo trong cấu hình hoạt động tích cực . Điều này có thể ngăn không cho cụm trở nên không khả dụng nếu một nút lãnh đạo bị lỗi.
Ngoài khả năng chịu lỗi cao hơn, các cụm có thể cải thiện khả năng phục hồi bằng cách giúp các nút đã khôi phục dễ dàng tham gia lại hệ thống và đưa cụm về kích thước tối ưu của nó. Bất kỳ khoảng thời gian ngừng hoạt động nào của hệ thống đều gây tốn kém cho tổ chức và có thể tạo ra trải nghiệm kém cho khách hàng, vì vậy điều quan trọng là hệ thống phải có khả năng phục hồi và chịu được lỗi trong trường hợp bị lỗi. Sử dụng một cụm có thể cải thiện khả năng phục hồi và khả năng chịu lỗi của hệ thống, cho phép khả năng sẵn sàng cao hơn. Các cụm có các đặc điểm này được gọi là các cụm “khả dụng cao” hoặc “không đạt”.
2. Cân bằng tải
Cân bằng tải là hành động phân phối lưu lượng truy cập qua các nút của một cụm để tối ưu hóa hiệu suất và ngăn chặn bất kỳ nút đơn lẻ nào nhận khối lượng công việc không tương xứng. Bộ cân bằng tải có thể được cài đặt trên (các) nút dẫn đầu hoặc được cung cấp riêng biệt với cụm. Bằng cách thực hiện kiểm tra tình trạng định kỳ trên mỗi nút trong cụm, bộ cân bằng tải có thể phát hiện xem một nút có bị lỗi hay không và nếu có, nó sẽ định tuyến lưu lượng đến các nút khác trong cụm.
Mặc dù một cụm máy tính không cân bằng tải nguyên bản, nhưng nó cho phép thực hiện cân bằng tải trên các nút của nó. Cấu hình này được gọi là một cụm “cân bằng tải”, và thường đồng thời là một cụm có tính khả dụng cao.
3. Mở rộng quy mô
Có hai cách phân loại tỷ lệ: dọc và ngang. Chia tỷ lệ theo chiều dọc (còn được gọi là tăng / giảm tỷ lệ) liên quan đến việc tăng hoặc giảm tài nguyên được phân bổ cho một quy trình, chẳng hạn như dung lượng bộ nhớ, số lõi bộ xử lý hoặc bộ nhớ khả dụng. Mặt khác, tỷ lệ theo chiều ngang (thu nhỏ / vào) là khi các công việc bổ sung, song song được chạy trên hệ thống.
Khi duy trì một cụm, điều quan trọng là phải theo dõi việc sử dụng tài nguyên và quy mô để đảm bảo tài nguyên cụm đang được sử dụng một cách thích hợp. May mắn thay, bản chất của một cụm làm cho việc mở rộng quy mô theo chiều ngang trở nên đơn giản – quản trị viên chỉ cần thêm hoặc xóa các nút khi cần thiết, lưu ý mức độ dự phòng tối thiểu để đảm bảo cụm vẫn khả dụng cao.
4. Hiệu suất
Khi nói đến song song, các cụm có thể đạt được mức hiệu suất cao hơn so với một máy đơn lẻ. Điều này là do chúng không bị giới hạn bởi một số lõi xử lý nhất định hoặc phần cứng khác. Ngoài ra, chia tỷ lệ theo chiều ngang có thể tối đa hóa hiệu suất bằng cách ngăn hệ thống hết tài nguyên.
Các cụm “Máy tính hiệu suất cao” (HPC) tận dụng khả năng song song hóa của các cụm máy tính để đạt được mức hiệu suất cao nhất có thể. Một siêu máy tính là một ví dụ phổ biến của một cụm HPC.