Giải thuật và lập trình: §2. Phương pháp sinh (GENERATION)

Các khóa học qua video:

Python SQL Server PHP C# Lập trình C Java HTML5-CSS3-JavaScript

Học trên YouTube <76K/tháng. Đăng ký Hội viên

Viết nhanh hơn - Học tốt hơn
Giải phóng thời gian, khai phóng năng lực

Phương pháp sinh có thể áp dụng để giải bài toán liệt kê tổ hợp đặt ra nếu như hai điều kiện sau thoả mãn:

Có thể xác định được một thứ tự trên tập các cấu hình tổ hợp cần liệt kê. Từ đó có thể biết đượccấu hình đầu tiên và cấu hình cuối cùng trong thứ tự đó.
Xây dựng được thuật toán từ một cấu hình chưa phải cấu hình cuối, sinh ra được cấu hình kế tiếp nó.

Phương pháp sinh có thể mô tả như sau:

<Xây dựng cấu hình đầu tiên>;

repeat

<Đưa ra cấu hình đang có>;

<Từ cấu hình đang có sinh ra cấu hình kế tiếp nếu còn>;

until <hết cấu hình>;

Thứ tự từ điển

Trên các kiểu dữ liệu đơn giản chuẩn, người ta thường nói tới khái niệm thứ tự. Ví dụ trên kiểu số thì có quan hệ: 1 < 2; 2 < 3; 3 < 10; …, trên kiểu ký tự Char thì cũng có quan hệ 'A' < 'B'; 'C' < 'c'… Xét quan hệ thứ tự toàn phần "nhỏ hơn hoặc bằng" ký hiệu "≤" trên một tập hợp S, là quan hệ hai ngôi thoả mãn bốn tính chất:

Với mọi a, b, c ϵ S

Tính phổ biến: Hoặc là a ≤ b, hoặc b ≤ a;

Tính phản xạ: a ≤ a

Tính phản đối xứng: Nếu a ≤ b và b ≤ a thì bắt buộc a = b. Tính bắc cầu: Nếu có a ≤ b và b ≤ c thì a ≤ c.

Trong trường hợp a ≤ b và a ≠ b, ta dùng ký hiệu "<" cho gọn, (ta ngầm hiểu các ký hiệu như ≥, >, khỏi phải định nghĩa).

Ví dụ như quan hệ "≤" trên các số nguyên cũng như trên các kiểu vô hướng, liệt kê là quan hệ thứ tự toàn phần.

Trên các dãy hữu hạn, người ta cũng xác định một quan hệ thứ tự:

Xét a = (a1, a2, …, an) và b = (b1, b2, …, bn); trên các phần tử của a1, …, an, b1, …, bn đã có quan hệ thứ tự "≤". Khi đó a ≤ b nếu như:

Hoặc ai = bi với mọi i: 1 ≤ i ≤ n.

Hoặc tồn tại một số nguyên dương k: 1 ≤ k < n để:

a₁ = b₁

a₂ = b₂

…

a_k-1 = b_k-1

a_k = b_k

a_k+1 < b_k+1

Trong trường hợp này, ta có thể viết a < b.

Thứ tự đó gọi là thứ tự từ điển trên các dãy độ dài n.

Khi độ dài hai dãy a và b không bằng nhau, người ta cũng xác định được thứ tự từ điển. Bằng cách thêm vào cuối dãy a hoặc dãy b những phần tử đặc biệt gọi là phần tử Ø để độ dài của a và b bằng nhau, và coi những phần tử Ø này nhỏ hơn tất cả các phần tử khác, ta lại đưa về xác định thứ tự từ điển của hai dãy cùng độ dài. Ví dụ:

(1, 2, 3, 4) < (5, 6)

(a, b, c) < (a, b, c, d)

'calculator' < 'computer'

Sinh các cây nhị phân độ dài n

Một dãy nhị phân độ dài n là một dãy x = x₁x₂…x_n trong đó xi ϵ {0, 1} (mọi i : 1 ≤ i ≤ n).

Dễ thấy: một dãy nhị phân x độ dài n là biểu diễn nhị phân của một giá trị nguyên p(x) nào đó nằm trong đoạn [0, 2ⁿ - 1]. Số các dãy nhị phân độ dài n = số các số nguyên ϵ [0, 2ⁿ - 1] = 2ⁿ. Ta sẽ lập chương trình liệt kê các dãy nhị phân theo thứ tự từ điển có nghĩa là sẽ liệt kê lần lượt các dãy nhị phân biểu diễn các số nguyên theo thứ tự 0, 1,…, 2ⁿ-1.

Ví dụ: Khi n = 3, các dãy nhị phân độ dài 3 được liệt kê như sau:

p(x)	0	1	2	3	4	5	6	7
x	000	001	010	011	100	101	110	111

Như vậy dãy đầu tiên sẽ là 00…0 và dãy cuối cùng sẽ là 11…1. Nhận xét rằng nếu dãy x = (x₁, x₂, …, x_n) là dãy đang có và không phải dãy cuối cùng thì dãy kế tiếp sẽ nhận được bằng cách cộng thêm 1 ( theo cơ số 2 có nhớ) vào dãy hiện tại.

Ví dụ khi n = 8:

Dãy đang có:	10010000	Dãy đang có:	10010111
cộng thêm 1:	+ 1	cộng thêm 1:	+ 1
Dãy mới:	10010001	Dãy mới:	10011000

Như vậy kỹ thuật sinh cấu hình kế tiếp từ cấu hình hiện tại có thể mô tả như sau: Xét từ cuối dãy về đầu (xét từ hàng đơn vị lên), gặp số 0 đầu tiên thì thay nó bằng số 1 và đặt tất cả các phần tử phía sau vị trí đó bằng 0.

i := n;

while (i > 0) and (x_i = 1) do i := i - 1;

if i > 0 then

begin

x_i := 1;

for j := i + 1 to n do x_j := 0;

end;

Dữ liệu vào (Input): nhập từ file văn bản BSTR.INP chứa số nguyên dương n ≤ 30 Kết quả ra (Output): ghi ra file văn bản BSTR.OUT các dãy nhị phân độ dài n.

BSTR.INP	BSTR.OUT
3	000
	001
	010
	011
	100
	101
	110
	111

Giải thuật:

P_1_02_1.PAS * Thuật toán sinh liệt kê các dãy nhị phân độ dài n

program Binary_Strings;

const

InputFile = 'BSTR.INP';

OutputFile = 'BSTR.OUT';

max = 30;

var

x: array[1..max] of Integer;

n, i: Integer;

f: Text; begin

Assign(f, InputFile); Reset(f);

ReadLn(f, n);

Close(f);

Assign(f, OutputFile); Rewrite(f);

FillChar(x, SizeOf(x), 0); {Cấu hình ban đầu x₁ = x₂= … = x_n := 0}

repeat {Thuật toán sinh}

for i := 1 to n do Write(f, x[i]); {In ra cấu hình hiện tại}

WriteLn(f);

i := n; {x_i là phần tử cuối dãy, lùi dần i cho tới khi gặp số 0 hoặc khi i = 0 thì dừng}

while (i > 0) and (x[i] = 1) do Dec(i);

if i > 0 then {Chưa gặp phải cấu hình 11…1}

begin

x[i] := 1; {Thay x_i bằng số 1}

FillChar(x[i + 1], (n - i) * SizeOf(x[1]), 0); {Đặt x_{i + 1} = x_{i + 2} = … = x_n := 0}

end;

until i = 0; {Đã hết cấu hình}

Close(f);

end.

Liệt kê các tập con k phần tử

Ta sẽ lập chương trình liệt kê các tập con k phần tử của tập {1, 2, …, n} theo thứ tự từ điền

Ví dụ: với n = 5, k = 3, ta phải liệt kê đủ 10 tập con:

1.{1, 2, 3} 2.{1, 2, 4} 3.{1, 2, 5} 4.{1, 3, 4} 5.{1, 3, 5}

6.{1, 4, 5} 7.{2, 3, 4} 8.{2, 3, 5} 9.{2, 4, 5} 10.{3, 4, 5}

Như vậy tập con đầu tiên (cấu hình khởi tạo) là {1, 2, …, k}. Cấu hình kết thúc là {n - k + 1, n - k + 2, …, n}.

Nhận xét: Ta sẽ in ra tập con bằng cách in ra lần lượt các phần tử của nó theo thứ tự tăng dần. Từ đó, ta có nhận xét nếu x = {x₁, x₂, …, x_k} và x₁ < x₂ < … < x_k thì giới hạn trên (giá trị lớn nhất có thể nhận) của xk là n, của x_k-1 là n - 1, của x_k-2 là n - 2, …

Cụ thể: giới hạn trên của x_i = n - k + i;

Còn tất nhiên, giới hạn dưới của x_i (giá trị nhỏ nhất xi có thể nhận) là xi-1 + 1.

Như vậy nếu ta đang có một dãy x đại diện cho một tập con, nếu x là cấu hình kết thúc có nghĩa là tất cả các phần tử trong x đều đã đạt tới giới hạn trên thì quá trình sinh kết thúc, nếu không thì ta phải sinh ra một dãy x mới tăng dần thoả mãn vừa đủ lớn hơn dãy cũ theo nghĩa không có một tập con k phần tử nào chen giữa chúng khi sắp thứ tự từ điển.

Ví dụ: n = 9, k = 6. Cấu hình đang có x = {1, 2, 6, 7, 8, 9}. Các phần tử x₃ đến x₆ đã đạt tới giới hạn trên nên để sinh cấu hình mới ta không thể sinh bằng cách tăng một phần tử trong số các x₆, x₅, x₄, x₃ lên được, ta phải tăng x₂ = 2 lên thành x₂ = 3. Được cấu hình mới là x = {1, 3, 6, 7, 8, 9}. Cấu hình này đã thoả mãn lớn hơn cấu hình trước nhưng chưa thoả mãn tính chất vừa đủ lớn, muốn vậy ta lại thay x₃, x₄, x₅, x₆ bằng các giới hạn dưới của nó. Tức là:

· x₃ := x₂ + 1 = 4

· x₄ := x₃ + 1 = 5

· x₅ := x₄ + 1 = 6

· x₆ := x₅ + 1 = 7

Ta được cấu hình mới x = {1, 3, 4, 5, 6, 7} là cấu hình kế tiếp. Nếu muốn tìm tiếp, ta lại nhận thấy rằng x₆ = 7 chưa đạt giới hạn trên, như vậy chỉ cần tăng x₆ lên 1 là được x = {1, 3, 4, 5, 6, 8}.

Vậy kỹ thuật sinh tập con kế tiếp từ tập đã có x có thể xây dựng như sau:

Tìm từ cuối dãy lên đầu cho tới khi gặp một phần tử x_i chưa đạt giới hạn trên n - k + i.

i := n;

while (i > 0) and (x_i = n - k + i) do i := i - 1; //(1, 2, 6, 7, 8, 9);

Nếu tìm thấy:

if i > 0 then

Tăng x_i đó lên 1.

x_i := x_i + 1; //(1, 3, 6, 7, 8, 9)

Đặt tất cả các phần tử phía sau xi bằng giới hạn dưới:

for j := i + 1 to k do x_j := x_j-1 + 1; //(1, 3, 4, 5, 6, 7)

Input: file văn bản SUBSET.INP chứa hai số nguyên dương n, k (1 ≤ k ≤ n ≤ 30) cách nhau ít nhất một dấu cách.

Output: file văn bản SUBSET.OUT các tập con k phần tử của tập {1, 2, …, n}.

SUBSET.INP	SUBSET.OUT
5 3	{1, 2, 3}
	{1, 2, 4}
	{1, 2, 5}
	{1, 3, 4}
	{1, 3, 5}
	{1, 4, 5}
	{2, 3, 4}
	{2, 3, 5}
	{2, 4, 5}
	{3, 4, 5}

Giải thuật:

P_1_02_2.PAS * Thuật toán sinh liệt kê các tập con k phần tử

program Combination; const

InputFile = 'SUBSET.INP';

OutputFile = 'SUBSET.OUT';

max = 30;

var

x: array[1..max] of Integer;

n, k, i, j: Integer;

f: Text; begin

Assign(f, InputFile); Reset(f);

ReadLn(f, n, k);

Close(f);

Assign(f, OutputFile); Rewrite(f);

for i := 1 to k do x[i] := i; {x₁ := 1; x₂:= 2; … ; x_k := k (Cấu hình khởi tạo)}

repeat

{In ra cấu hình hiện tại}

Write(f, '{');

for i := 1 to k - 1 do Write(f, x[i], ', ');

WriteLn(f, x[k], '}');

{Sinh tiếp}

i := k; {x_i là phần tử cuối dãy, lùi dần i cho tới khi gặp một x_i chưa đạt giới hạn trên n - k + i}

while (i > 0) and (x[i] = n - k + i) do Dec(i);

if i > 0 then {Nếu chưa lùi đến 0 có nghĩa là chưa phải cấu hình kết thúc}

begin

Inc(x[i]); {Tăng x_i lên 1, Đặt các phần tử đứng sau x_i bằng giới hạn dưới của nó}

for j := i + 1 to k do x[j] := x[j - 1] + 1; end;

until i = 0; {Lùi đến tận 0 có nghĩa là tất cả các phần tử đã đạt giới hạn trên - hết cấu hình}

Close(f);

end.

Liệt kê các hoán vị

Ta sẽ lập chương trình liệt kê các hoán vị của {1, 2, …, n} theo thứ tự từ điển.

Ví dụ với n = 4, ta phải liệt kê đủ 24 hoán vị:

1.1234	2.1243	3.1324	4.1342	5.1423	6.1432
7.2134	8.2143	9.2314	10.2341	11.2413	12.2431
13.3124	14.3142	15.3214	16.3241	17.3412	18.3421
19.4123	20.4132	21.4213	22.4231	23.4312	24.4321

Như vậy hoán vị đầu tiên sẽ là (1, 2, …, n). Hoán vị cuối cùng là (n, n-1, … , 1).

Hoán vị sẽ sinh ra phải lớn hơn hoán vị hiện tại, hơn thế nữa phải là hoán vị vừa đủ lớn hơn hoán vị hiện tại theo nghĩa không thể có một hoán vị nào khác chen giữa chúng khi sắp thứ tự.

Giả sử hoán vị hiện tại là x = (3, 2, 6, 5, 4, 1), xét 4 phần tử cuối cùng, ta thấy chúng được xếp giảm dần, điều đó có nghĩa là cho dù ta có hoán vị 4 phần tử này thế nào, ta cũng được một hoán vị bé hơn hoán vị hiện tại!. Như vậy ta phải xét đến x₂ = 2, thay nó bằng một giá trị khác. Ta sẽ thay bằng giá trị nào?, không thể là 1 bởi nếu vậy sẽ được hoán vị nhỏ hơn, không thể là 3 vì đã có x₁ = 3 rồi (phần tử sau không được chọn vào những giá trị mà phần tử trước đã chọn). Còn lại các giá trị 4, 5, 6. Vì cần một hoán vị vừa đủ lớn hơn hiện tại nên ta chọn x₂ = 4. Còn các giá trị (x₃, x₄, x₅, x₆) sẽ lấy trong tập {2, 6, 5, 1}. Cũng vì tính vừa đủ lớn nên ta sẽ tìm biểu diễn nhỏ nhất của 4 số này gán cho x₃, x₄, x₅, x₆ tức là (1, 2, 5, 6). Vậy hoán vị mới sẽ là (3, 4, 1, 2, 5, 6).

(3, 2, 6, 5, 4, 1) → (3, 4, 1, 2, 5, 6).

Ta có nhận xét gì qua ví dụ này: Đoạn cuối của hoán vị được xếp giảm dần, số x₅ = 4 là số nhỏ nhất trong đoạn cuối giảm dần thoả mãn điều kiện lớn hơn x₂ = 2. Nếu đổi chỗ x₅ cho x₂ thì ta sẽ được x₂ = 4 và đoạn cuối vẫn được sắp xếp giảm dần. Khi đó muốn biểu diễn nhỏ nhất cho các giá trị trong đoạn cuối thì ta chỉ cần đảo ngược đoạn cuối.

Trong trường hợp hoán vị hiện tại là (2, 1, 3, 4) thì hoán vị kế tiếp sẽ là (2, 1, 4, 3). Ta cũng có thể coi hoán vị (2, 1, 3, 4) có đoạn cuối giảm dần, đoạn cuối này chỉ gồm 1 phần tử (4)

Vậy kỹ thuật sinh hoán vị kế tiếp từ hoán vị hiện tại có thể xây dựng như sau:

Xác định đoạn cuối giảm dần dài nhất, tìm chỉ số i của phần tử x_i đứng liền trước đoạn cuối đó. Điều này đồng nghĩa với việc tìm từ vị trí sát cuối dãy lên đầu, gặp chỉ số i đầu tiên thỏa mãn x_i < x_i+1. Nếu toàn dãy đã là giảm dần, thì đó là cấu hình cuối.

i := n - 1;

while (i > 0) and (x_i > x_i+1) do i := i - 1;

Trong đoạn cuối giảm dần, tìm phần tử x_k nhỏ nhất thoả mãn điều kiện x_k > x_i. Do đoạn cuối giảm dần, điều này thực hiện bằng cách tìm từ cuối dãy lên đầu gặp chỉ số k đầu tiên thoả mãn x_k > x_i (có thể dùng tìm kiếm nhị phân).

k := n;

while x_k < x_i do k := k - 1;

Đổi chỗ x_k và x_i, lật ngược thứ tự đoạn cuối giảm dần (từ x_i+1 đến x_k) trở thành tăng dần.

Input: file văn bản PERMUTE.INP chứa số nguyên dương n ≤ 12

Output: file văn bản PERMUTE.OUT các hoán vị của dãy (1, 2, …, n)

PERMUTE.INP	PERMUTE.OUT
3	1 2 3
	1 3 2
	2 1 3
	2 3 1
	3 1 2
	3 2 1

Giải thuật:

P_1_02_3.PAS * Thuật toán sinh liệt kê hoán vị

program Permutation; const

InputFile = 'PERMUTE.INP';

OutputFile = 'PERMUTE.OUT';

max = 12;

var

n, i, k, a, b: Integer;

x: array[1..max] of Integer;

f: Text;

procedure Swap(var X, Y: Integer); {Thủ tục đảo giá trị hai tham biến X, Y}

var

Temp: Integer;

begin

Temp := X; X := Y; Y := Temp;

end;

begin

Assign(f, InputFile); Reset(f);

ReadLn(f, n);

Close(f);

Assign(f, OutputFile); Rewrite(f);

for i := 1 to n do x[i] := i; {Khởi tạo cấu hình đầu: x₁ := 1; x₂ := 2; …, x_n := n}

repeat

for i := 1 to n do Write(f, x[i], ' '); {In ra cấu hình hoán vị hiện tại}

WriteLn(f); i := n - 1;

while (i > 0) and (x[i] > x[i + 1]) do Dec(i);

if i > 0 then {Chưa gặp phải hoán vị cuối (n, n-1, … ,1)}

begin

k := n; {x_k là phần tử cuối dãy}

while x[k] < x[i] do Dec(k); {Lùi dần k để tìm gặp x_k đầu tiên lớn hơn x_i }

Swap(x[k], x[i]); {Đổi chỗ x_k và x_i}

a := i + 1; b := n; {Lật ngược đoạn cuối giảm dần, a: đầu đoạn, b: cuối đoạn}

while a < b do begin

Swap(x[a], x[b]); {Đổi chỗ xa và xb}

Inc(a); {Tiến a và lùi b, đổi chỗ tiếp cho tới khi a, b chạm nhau}

Dec(b); end;

end;

until i = 0; {Toàn dãy là dãy giảm dần - không sinh tiếp được - hết cấu hình}

Close(f);

end.

Bài tập

Bài 1

Các chương trình trên xử lý không tốt trong trường hợp tầm thường, đó là trường hợp n = 0 đối với chương trình liệt kê dãy nhị phân cũng như trong chương trình liệt kê hoán vị, trường hợp k = 0 đối với chương trình liệt kê tổ hợp, hãy khắc phục điều đó.

Bài 2

Liệt kê các dãy nhị phân độ dài n có thể coi là liệt kê các chỉnh hợp lặp chập n của tập 2 phần tử {0, 1}. Hãy lập chương trình:

Nhập vào hai số n và k, liệt kê các chỉnh hợp lặp chập k của {0, 1, …, n -1}.

Gợi ý: thay hệ cơ số 2 bằng hệ cơ số n.

Bài 3

Hãy liệt kê các dãy nhị phân độ dài n mà trong đó cụm chữ số "01" xuất hiện đúng 2 lần.

Bài 4.

Nhập vào một danh sách n tên người. Liệt kê tất cả các cách chọn ra đúng k người trong số n người đó.

Gợi ý: xây dựng một ánh xạ từ tập {1, 2, …, n} đến tập các tên người. Ví dụ xây dựng một mảng Tên: Tên[1] := 'Nguyễn văn A'; Tên[2] := 'Trần thị B';…. sau đó liệt kê tất cả các tập con k phần tử của tập {1, 2, …, n}. Chỉ có điều khi in tập con, ta không in giá trị số {1, 3, 5} mà thay vào đó sẽ in ra {Tên[1], Tên [3], Tên[5]}. Tức là in ra ảnh của các giá trị tìm được qua ánh xạ.

Bài 5

Liệt kê tất cả các tập con của tập {1, 2, …, n}. Có thể dùng phương pháp liệt kê tập con như trên hoặc dùng phương pháp liệt kê tất cả các dãy nhị phân. Mỗi số 1 trong dãy nhị phân tương ứng với một phần tử được chọn trong tập. Ví dụ với tập {1, 2, 3, 4} thì dãy nhị phân 1010 sẽ tương ứng với tập con {1, 3}. Hãy lập chương trình in ra tất cả các tập con của {1, 2, …, n} theo hai phương pháp.

Bài 6

Nhập vào danh sách tên n người, in ra tất cả các cách xếp n người đó vào một bàn.

Bài 7

Nhập vào danh sách n bạn nam và n bạn nữ, in ra tất cả các cách xếp 2n người đó vào một bàn tròn, mỗi bạn nam tiếp đến một bạn nữ.

Bài 8

Người ta có thể dùng phương pháp sinh để liệt kê các chỉnh hợp không lặp chập k. Tuy nhiên có một cách khác là liệt kê tất cả các tập con k phần tử của tập hợp, sau đó in ra đủ k! hoán vị của nó. Hãy viết chương trình liệt kê các chỉnh hợp không lặp chập k của {1, 2, …, n} theo cả hai cách.

Bài 9

Liệt kê tất cả các hoán vị chữ cái trong từ MISSISSIPPI theo thứ tự từ điển.

Bài 10

Liệt kê tất cả các cách phân tích số nguyên dương n thành tổng các số nguyên dương, hai cách phân tích là hoán vị của nhau chỉ tính là một cách.

Cuối cùng, ta có nhận xét, mỗi phương pháp liệt kê đều có ưu, nhược điểm riêng và phương pháp sinh cũng không nằm ngoài nhận xét đó. Phương pháp sinh không thể sinh ra được cấu hình thứ p nếu như chưa có cấu hình thứ p - 1, chứng tỏ rằng phương pháp sinh tỏ ra ưu điểm trong trường hợp liệt kê toàn bộ một số lượng nhỏ cấu hình trong một bộ dữ liệu lớn thì lại có nhược điểm và ít tính phổ dụng trong những thuật toán duyệt hạn chế. Hơn thế nữa, không phải cấu hình ban đầu lúc nào cũng dễ tìm được, không phải kỹ thuật sinh cấu hình kế tiếp cho mọi bài toán đều đơn giản như trên (Sinh các chỉnh hợp không lặp chập k theo thứ tự từ điển chẳng hạn). Ta sang một chuyên mục sau nói đến một phương pháp liệt kê có tính phổ dụng cao hơn, để giải các bài toán liệt kê phức tạp hơn đó là: Thuật toán quay lui (Back tracking).

Nguồn: Giáo trình Giải thuật và Lập trình - Lê Minh Hoàng - Đại học sư phạm Hà Nội

» Tiếp: §3. Thuật toán quay lui

« Trước: §1. Nhắc lại một số kiến thức đại số tổ hợp

Các khóa học qua video:

Python SQL Server PHP C# Lập trình C Java HTML5-CSS3-JavaScript

Học trên YouTube <76K/tháng. Đăng ký Hội viên

Viết nhanh hơn - Học tốt hơn
Giải phóng thời gian, khai phóng năng lực