add git_browser, git_anon, repo_url, source_name to yaml
[packages.grml.org.git] / update.rb
1 #!/usr/bin/env ruby
2 require 'git'
3 require 'erb'
4 require 'yaml'
5 require 'net/http'
6 require 'uri'
7 require 'zlib'
8 require 'yaml'
9
10 DEBUG = false
11
12 def build_used_package_list(source_uri)
13   source_uri.map do |source_uri|
14     fetch_file(source_uri).split("\n").reject do |l|
15       l.strip.start_with?('#') or l.strip == ""
16     end
17   end.flatten
18 end
19
20 def parse_debian_sources(data)
21   data.split("\n").push('').inject({}) do |pkgs, l|
22     l.rstrip!
23     pkg = pkgs[:_tmp] || {}
24     if pkg[:_tmp]
25       if l[0..0] == ' '
26         pkg[:_tmp][:data] << l.strip
27       else
28         pkg[pkg[:_tmp][:hdr]] = pkg[:_tmp][:data].compact
29         pkg.delete :_tmp
30       end
31     end
32     unless pkg[:_tmp]
33       if l == '':
34         pkgs[pkg['Package'][0]] = pkg
35         pkg = nil
36       else
37         hdr, data = l.strip.split(':', 2)
38         data.strip! unless data.nil?
39         pkg[:_tmp] = {:hdr => hdr, :data => [data]}
40       end
41     end
42     if pkg.nil?
43       pkgs.delete :_tmp
44     else
45       pkgs[:_tmp] = pkg
46     end
47     pkgs
48   end
49 end
50
51 def build_package_list(repos, used, sources)
52   data = {}
53   repos.each do |pkg, path|
54     g = Git.bare(working_dir = path)
55     next if not g.ls_tree('HEAD')["tree"].keys.include?("debian")
56
57     current_head = g.gcommit('HEAD')
58     next if not current_head.parent
59
60     p = {
61       :head_is_tagged => false,
62       :used => {},
63       :name => pkg,
64       :version => nil,
65       :has_tags => false,
66       :version_in_repo => nil,
67       :git_browser => "http://git.grml.org/?p=%s.git;a=summary" % pkg,
68       :git_anon => "git://git.grml.org/%s.git" % pkg,
69       :repo_url => "http://deb.grml.org/pool/main/%s/%s/" % [pkg[0..0], pkg],
70     }
71     used.each do |dist,l|
72       p[:used][dist] = l.include?(pkg)
73     end
74     if sources[pkg]
75       p[:version_in_repo] = sources[pkg]['Version'][0]
76       p[:source_name] = sources[pkg]['Package'][0]
77     end
78
79     for tag in g.tags.reverse
80       p[:has_tags] = true
81       t = g.gcommit(tag.name)
82       next if not t.parent
83       #$stderr.puts "#{pkg}: Checking tag #{tag.name}: tag parent: #{t.parent.sha} HEAD: #{current_head.parent.sha}"
84       if t.parent.sha === current_head.parent.sha
85         p[:head_is_tagged] = true
86         p[:version] = tag.name
87         break
88       end
89     end
90
91     data[pkg] = p
92   end
93   data
94 end
95
96 def fetch_file(uri)
97   response = Net::HTTP.get_response(URI.parse(uri))
98   body = response.body
99   if uri.match(/\.gz$/)
100     body = Zlib::GzipReader.new(StringIO.new(body.to_s)).read
101   end
102   body
103 end
104
105 def update_git_repos(git_repos)
106   git_repos.each do |name, path|
107     out = %x{cd #{path} && git remote update --prune 2>&1}
108     puts "#{name}: " + out if DEBUG
109   end
110 end
111
112 template = ERB.new <<-EOF
113 <!doctype html>
114 <head>
115   <meta charset="utf-8">
116   <title>Grml.org Package Index</title>
117   <link rel="stylesheet" href="style.css">
118 </head>
119 <body>
120   <header>
121   <h1>All Grml packages</h1>
122   </header>
123   <div id="main">
124   <table>
125   <tr>
126   <th>Package</th><th>Git</th><th>Download</th><th>Git Fresh?</th><th>grml-testing</th><th>In FULL?</th>
127   </tr>
128   <% packages.keys.sort.each do |pn|
129   p = packages[pn]
130   %>
131   <tr>
132   <td><%= p[:name] %></td>
133   <td class="git"><a href="<%= p[:git_browser] %>">Git</a></td>
134   <td class="download">
135     <% if p[:has_tags] %>
136     <a href="<%= p[:repo_url] %>">Download</a>
137     <% end %>
138   </td>
139   <% if p[:head_is_tagged] %>
140   <td class="ok">Version <%= p[:version] %></td>
141   <% else %>
142   <td class="error <% if p[:used][:full] %>important<% end %>">Untagged changes</td>
143   <% end %>
144   <td><%= p[:version_in_repo] || "" %></td>
145   <td class="installed"><%= p[:used][:full] ? "Yes" : "No" %></td>
146   </tr>
147   <% end %>
148   </table>
149   </div>
150   <div>
151   Other packages: <%= other_packages.join(" ") %>
152   </div>
153   <footer>
154   <p>Last update: <%= Time.now.to_s %></p>
155   </footer>
156 </body>
157 </html>
158 EOF
159
160 used_packages = {
161   :full => build_used_package_list([
162                                     'http://git.grml.org/?p=grml-live.git;a=blob_plain;f=etc/grml/fai/config/package_config/GRMLBASE',
163                                     'http://git.grml.org/?p=grml-live.git;a=blob_plain;f=etc/grml/fai/config/package_config/GRML_FULL',
164                                    ]),
165 }
166 sources = {}
167 parse_debian_sources(fetch_file('http://deb.grml.org/dists/grml-testing/main/source/Sources.gz')).each do |k,v|
168   if v['Vcs-Git'] and v['Vcs-Git'][0]
169     m = v['Vcs-Git'][0].match 'git.grml.org\/(.*).git$'
170     k = m[1] if m
171   end
172   sources[k] = v
173 end
174
175 git_repos = Hash[*(Dir.glob('git/*.git').map do |p| [File.basename(p, '.git'), p] end.flatten)]
176
177 update_git_repos git_repos
178
179 packages = build_package_list(git_repos, used_packages, sources)
180 other_packages = (sources.keys - git_repos.keys)
181
182 File.open('index.html.new','w') do |f|
183   f.write template.result(binding)
184 end
185 File.open('packages.yaml.new','w') do |f|
186   f.write packages.to_yaml
187 end
188
189 FileUtils.mv 'index.html.new', 'index.html'
190 FileUtils.mv 'packages.yaml.new', 'packages.yaml'
191