upstream/mercurial-mirror Commit - r476:0a338d50

1

# revlog.py - storage back-end for mercurial

1

# revlog.py - storage back-end for mercurial

2

#

2

#

3

# This provides efficient delta storage with O(1) retrieve and append

3

# This provides efficient delta storage with O(1) retrieve and append

4

# and O(changes) merge between branches

4

# and O(changes) merge between branches

5

#

5

#

6

7

#

7

#

8

# This software may be used and distributed according to the terms

8

# This software may be used and distributed according to the terms

9

# of the GNU General Public License, incorporated herein by reference.

9

# of the GNU General Public License, incorporated herein by reference.

10

11

import zlib, struct, sha, binascii, heapq

11

import zlib, struct, sha, binascii, heapq

12

from mercurial import mdiff

12

from mercurial import mdiff

13

14

def hex(node): return binascii.hexlify(node)

14

def hex(node): return binascii.hexlify(node)

15

def bin(node): return binascii.unhexlify(node)

15

def bin(node): return binascii.unhexlify(node)

16

def short(node): return hex(node[:6])

16

def short(node): return hex(node[:6])

17

18

def compress(text):

18

def compress(text):

19

if not text: return text

19

if not text: return text

20

if len(text) < 44:

20

if len(text) < 44:

21

if text[0] == '\0': return text

21

if text[0] == '\0': return text

22

return 'u' + text

22

return 'u' + text

23

bin = zlib.compress(text)

23

bin = zlib.compress(text)

24

if len(bin) > len(text):

24

if len(bin) > len(text):

25

if text[0] == '\0': return text

25

if text[0] == '\0': return text

26

return 'u' + text

26

return 'u' + text

27

return bin

27

return bin

28

29

def decompress(bin):

29

def decompress(bin):

30

if not bin: return bin

30

if not bin: return bin

31

t = bin[0]

31

t = bin[0]

32

if t == '\0': return bin

32

if t == '\0': return bin

33

if t == 'x': return zlib.decompress(bin)

33

if t == 'x': return zlib.decompress(bin)

34

if t == 'u': return bin[1:]

34

if t == 'u': return bin[1:]

35

raise "unknown compression type %s" % t

35

raise "unknown compression type %s" % t

36

37

def hash(text, p1, p2):

37

def hash(text, p1, p2):

38

l = [p1, p2]

38

l = [p1, p2]

39

l.sort()

39

l.sort()

40

return sha.sha(l[0] + l[1] + text).digest()

40

return sha.sha(l[0] + l[1] + text).digest()

41

42

nullid = "\0" * 20

42

nullid = "\0" * 20

43

indexformat = ">4l20s20s20s"

43

indexformat = ">4l20s20s20s"

44

45

class lazyparser:

45

class lazyparser:

46

def __init__(self, data, revlog):

46

def __init__(self, data, revlog):

47

self.data = data

47

self.data = data

48

self.s = struct.calcsize(indexformat)

48

self.s = struct.calcsize(indexformat)

49

self.l = len(data)/self.s

49

self.l = len(data)/self.s

50

self.index = [None] * self.l

50

self.index = [None] * self.l

51

self.map = {nullid: -1}

51

self.map = {nullid: -1}

52

self.all = 0

52

self.all = 0

53

self.revlog = revlog

53

self.revlog = revlog

54

55

def load(self, pos=None):

55

def load(self, pos=None):

56

if self.all: return

56

if self.all: return

57

if pos is not None:

57

if pos is not None:

58

block = pos / 1000

58

block = pos / 1000

59

i = block * 1000

59

i = block * 1000

60

end = min(self.l, i + 1000)

60

end = min(self.l, i + 1000)

61

else:

61

else:

62

self.all = 1

62

self.all = 1

63

i = 0

63

i = 0

64

end = self.l

64

end = self.l

65

self.revlog.index = self.index

65

self.revlog.index = self.index

66

self.revlog.nodemap = self.map

66

self.revlog.nodemap = self.map

67

68

while i < end:

68

while i < end:

69

d = self.data[i * self.s: (i + 1) * self.s]

69

d = self.data[i * self.s: (i + 1) * self.s]

70

e = struct.unpack(indexformat, d)

70

e = struct.unpack(indexformat, d)

71

self.index[i] = e

71

self.index[i] = e

72

self.map[e[6]] = i

72

self.map[e[6]] = i

73

i += 1

73

i += 1

74

75

class lazyindex:

75

class lazyindex:

76

def __init__(self, parser):

76

def __init__(self, parser):

77

self.p = parser

77

self.p = parser

78

def __len__(self):

78

def __len__(self):

79

return len(self.p.index)

79

return len(self.p.index)

80

def load(self, pos):

80

def load(self, pos):

81

self.p.load(pos)

81

self.p.load(pos)

82

return self.p.index[pos]

82

return self.p.index[pos]

83

def __getitem__(self, pos):

83

def __getitem__(self, pos):

84

return self.p.index[pos] or self.load(pos)

84

return self.p.index[pos] or self.load(pos)

85

def append(self, e):

85

def append(self, e):

86

self.p.index.append(e)

86

self.p.index.append(e)

87

88

class lazymap:

88

class lazymap:

89

def __init__(self, parser):

89

def __init__(self, parser):

90

self.p = parser

90

self.p = parser

91

def load(self, key):

91

def load(self, key):

92

if self.p.all: return

92

if self.p.all: return

93

n = self.p.data.find(key)

93

n = self.p.data.find(key)

94

if n < 0: raise KeyError("node " + hex(key))

94

if n < 0: raise KeyError("node " + hex(key))

95

pos = n / self.p.s

95

pos = n / self.p.s

96

self.p.load(pos)

96

self.p.load(pos)

97

def __contains__(self, key):

97

def __contains__(self, key):

98

self.p.load()

98

self.p.load()

99

return key in self.p.map

99

return key in self.p.map

100

def __iter__(self):

100

def __iter__(self):

101

yield nullid

101

yield nullid

102

for i in xrange(self.p.l):

102

for i in xrange(self.p.l):

103

try:

103

try:

104

yield self.p.index[i][6]

104

yield self.p.index[i][6]

105

except:

105

except:

106

self.p.load(i)

106

self.p.load(i)

107

yield self.p.index[i][6]

107

yield self.p.index[i][6]

108

def __getitem__(self, key):

108

def __getitem__(self, key):

109

try:

109

try:

110

return self.p.map[key]

110

return self.p.map[key]

111

except KeyError:

111

except KeyError:

112

try:

112

try:

113

self.load(key)

113

self.load(key)

114

return self.p.map[key]

114

return self.p.map[key]

115

except KeyError:

115

except KeyError:

116

raise KeyError("node " + hex(key))

116

raise KeyError("node " + hex(key))

117

def __setitem__(self, key, val):

117

def __setitem__(self, key, val):

118

self.p.map[key] = val

118

self.p.map[key] = val

119

120

class revlog:

120

class revlog:

121

def __init__(self, opener, indexfile, datafile):

121

def __init__(self, opener, indexfile, datafile):

122

self.indexfile = indexfile

122

self.indexfile = indexfile

123

self.datafile = datafile

123

self.datafile = datafile

124

self.opener = opener

124

self.opener = opener

125

self.cache = None

125

self.cache = None

126

127

try:

127

try:

128

i = self.opener(self.indexfile).read()

128

i = self.opener(self.indexfile).read()

129

except IOError:

129

except IOError:

130

i = ""

130

i = ""

131

132

if len(i) > 10000:

132

if len(i) > 10000:

133

# big index, let's parse it on demand

133

# big index, let's parse it on demand

134

parser = lazyparser(i, self)

134

parser = lazyparser(i, self)

135

self.index = lazyindex(parser)

135

self.index = lazyindex(parser)

136

self.nodemap = lazymap(parser)

136

self.nodemap = lazymap(parser)

137

else:

137

else:

138

s = struct.calcsize(indexformat)

138

s = struct.calcsize(indexformat)

139

l = len(i) / s

139

l = len(i) / s

140

self.index = [None] * l

140

self.index = [None] * l

141

m = [None] * l

141

m = [None] * l

142

143

n = 0

143

n = 0

144

for f in xrange(0, len(i), s):

144

for f in xrange(0, len(i), s):

145

# offset, size, base, linkrev, p1, p2, nodeid

145

# offset, size, base, linkrev, p1, p2, nodeid

146

e = struct.unpack(indexformat, i[f:f + s])

146

e = struct.unpack(indexformat, i[f:f + s])

147

m[n] = (e[6], n)

147

m[n] = (e[6], n)

148

self.index[n] = e

148

self.index[n] = e

149

n += 1

149

n += 1

150

151

self.nodemap = dict(m)

151

self.nodemap = dict(m)

152

self.nodemap[nullid] = -1

152

self.nodemap[nullid] = -1

153

154

155

def tip(self): return self.node(len(self.index) - 1)

155

def tip(self): return self.node(len(self.index) - 1)

156

def count(self): return len(self.index)

156

def count(self): return len(self.index)

157

def node(self, rev): return (rev < 0) and nullid or self.index[rev][6]

157

def node(self, rev): return (rev < 0) and nullid or self.index[rev][6]

158

def rev(self, node): return self.nodemap[node]

158

def rev(self, node): return self.nodemap[node]

159

def linkrev(self, node): return self.index[self.nodemap[node]][3]

159

def linkrev(self, node): return self.index[self.nodemap[node]][3]

160

def parents(self, node):

160

def parents(self, node):

161

if node == nullid: return (nullid, nullid)

161

if node == nullid: return (nullid, nullid)

162

return self.index[self.nodemap[node]][4:6]

162

return self.index[self.nodemap[node]][4:6]

163

164

def start(self, rev): return self.index[rev][0]

164

def start(self, rev): return self.index[rev][0]

165

def length(self, rev): return self.index[rev][1]

165

def length(self, rev): return self.index[rev][1]

166

def end(self, rev): return self.start(rev) + self.length(rev)

166

def end(self, rev): return self.start(rev) + self.length(rev)

167

def base(self, rev): return self.index[rev][2]

167

def base(self, rev): return self.index[rev][2]

168

169

def heads(self):

169

def heads(self):

170

p = {}

170

p = {}

171

h = []

171

h = []

172

for r in range(self.count() - 1, -1, -1):

172

for r in range(self.count() - 1, -1, -1):

173

n = self.node(r)

173

n = self.node(r)

174

if n not in p:

174

if n not in p:

175

h.append(n)

175

h.append(n)

176

for pn in self.parents(n):

176

for pn in self.parents(n):

177

p[pn] = 1

177

p[pn] = 1

178

return h

178

return h

179

180

def children(self, node):

180

def children(self, node):

181

c = []

181

c = []

182

p = self.rev(node)

182

p = self.rev(node)

183

for r in range(p + 1, self.count()):

183

for r in range(p + 1, self.count()):

184

n = self.node(r)

184

n = self.node(r)

185

for pn in self.parents(n):

185

for pn in self.parents(n):

186

if pn == p:

186

if pn == p:

187

c.append(p)

187

c.append(p)

188

continue

188

continue

189

elif pn == nullid:

189

elif pn == nullid:

190

continue

190

continue

191

return c

191

return c

192

193

def lookup(self, id):

193

def lookup(self, id):

194

try:

194

try:

195

rev = int(id)

195

rev = int(id)

196

if str(rev) != id: raise ValueError

196

if str(rev) != id: raise ValueError

197

if rev < 0: rev = self.count() + rev

197

if rev < 0: rev = self.count() + rev

198

if rev < 0 or rev >= self.count: raise ValueError

198

if rev < 0 or rev >= self.count(): raise ValueError

199

return self.node(rev)

199

return self.node(rev)

200

except (ValueError, OverflowError):

200

except (ValueError, OverflowError):

201

c = []

201

c = []

202

for n in self.nodemap:

202

for n in self.nodemap:

203

if hex(n).startswith(id):

203

if hex(n).startswith(id):

204

c.append(n)

204

c.append(n)

205

if len(c) > 1: raise KeyError("Ambiguous identifier")

205

if len(c) > 1: raise KeyError("Ambiguous identifier")

206

if len(c) < 1: raise KeyError("No match found")

206

if len(c) < 1: raise KeyError("No match found")

207

return c[0]

207

return c[0]

208

209

return None

209

return None

210

211

def diff(self, a, b):

211

def diff(self, a, b):

212

return mdiff.textdiff(a, b)

212

return mdiff.textdiff(a, b)

213

214

def patches(self, t, pl):

214

def patches(self, t, pl):

215

return mdiff.patches(t, pl)

215

return mdiff.patches(t, pl)

216

217

def delta(self, node):

217

def delta(self, node):

218

r = self.rev(node)

218

r = self.rev(node)

219

b = self.base(r)

219

b = self.base(r)

220

if r == b:

220

if r == b:

221

return self.diff(self.revision(self.node(r - 1)),

221

return self.diff(self.revision(self.node(r - 1)),

222

self.revision(node))

222

self.revision(node))

223

else:

223

else:

224

f = self.opener(self.datafile)

224

f = self.opener(self.datafile)

225

f.seek(self.start(r))

225

f.seek(self.start(r))

226

data = f.read(self.length(r))

226

data = f.read(self.length(r))

227

return decompress(data)

227

return decompress(data)

228

229

def revision(self, node):

229

def revision(self, node):

230

if node == nullid: return ""

230

if node == nullid: return ""

231

if self.cache and self.cache[0] == node: return self.cache[2]

231

if self.cache and self.cache[0] == node: return self.cache[2]

232

233

text = None

233

text = None

234

rev = self.rev(node)

234

rev = self.rev(node)

235

start, length, base, link, p1, p2, node = self.index[rev]

235

start, length, base, link, p1, p2, node = self.index[rev]

236

end = start + length

236

end = start + length

237

if base != rev: start = self.start(base)

237

if base != rev: start = self.start(base)

238

239

if self.cache and self.cache[1] >= base and self.cache[1] < rev:

239

if self.cache and self.cache[1] >= base and self.cache[1] < rev:

240

base = self.cache[1]

240

base = self.cache[1]

241

start = self.start(base + 1)

241

start = self.start(base + 1)

242

text = self.cache[2]

242

text = self.cache[2]

243

last = 0

243

last = 0

244

245

f = self.opener(self.datafile)

245

f = self.opener(self.datafile)

246

f.seek(start)

246

f.seek(start)

247

data = f.read(end - start)

247

data = f.read(end - start)

248

249

if not text:

249

if not text:

250

last = self.length(base)

250

last = self.length(base)

251

text = decompress(data[:last])

251

text = decompress(data[:last])

252

253

bins = []

253

bins = []

254

for r in xrange(base + 1, rev + 1):

254

for r in xrange(base + 1, rev + 1):

255

s = self.length(r)

255

s = self.length(r)

256

bins.append(decompress(data[last:last + s]))

256

bins.append(decompress(data[last:last + s]))

257

last = last + s

257

last = last + s

258

259

text = mdiff.patches(text, bins)

259

text = mdiff.patches(text, bins)

260

261

if node != hash(text, p1, p2):

261

if node != hash(text, p1, p2):

262

raise IOError("integrity check failed on %s:%d"

262

raise IOError("integrity check failed on %s:%d"

263

% (self.datafile, rev))

263

% (self.datafile, rev))

264

265

self.cache = (node, rev, text)

265

self.cache = (node, rev, text)

266

return text

266

return text

267

268

def addrevision(self, text, transaction, link, p1=None, p2=None):

268

def addrevision(self, text, transaction, link, p1=None, p2=None):

269

if text is None: text = ""

269

if text is None: text = ""

270

if p1 is None: p1 = self.tip()

270

if p1 is None: p1 = self.tip()

271

if p2 is None: p2 = nullid

271

if p2 is None: p2 = nullid

272

273

node = hash(text, p1, p2)

273

node = hash(text, p1, p2)

274

275

if node in self.nodemap:

275

if node in self.nodemap:

276

return node

276

return node

277

278

n = self.count()

278

n = self.count()

279

t = n - 1

279

t = n - 1

280

281

if n:

281

if n:

282

base = self.base(t)

282

base = self.base(t)

283

start = self.start(base)

283

start = self.start(base)

284

end = self.end(t)

284

end = self.end(t)

285

prev = self.revision(self.tip())

285

prev = self.revision(self.tip())

286

d = self.diff(prev, text)

286

d = self.diff(prev, text)

287

data = compress(d)

287

data = compress(d)

288

dist = end - start + len(data)

288

dist = end - start + len(data)

289

290

# full versions are inserted when the needed deltas

290

# full versions are inserted when the needed deltas

291

# become comparable to the uncompressed text

291

# become comparable to the uncompressed text

292

if not n or dist > len(text) * 2:

292

if not n or dist > len(text) * 2:

293

data = compress(text)

293

data = compress(text)

294

base = n

294

base = n

295

else:

295

else:

296

base = self.base(t)

296

base = self.base(t)

297

298

offset = 0

298

offset = 0

299

if t >= 0:

299

if t >= 0:

300

offset = self.end(t)

300

offset = self.end(t)

301

302

e = (offset, len(data), base, link, p1, p2, node)

302

e = (offset, len(data), base, link, p1, p2, node)

303

304

self.index.append(e)

304

self.index.append(e)

305

self.nodemap[node] = n

305

self.nodemap[node] = n

306

entry = struct.pack(indexformat, *e)

306

entry = struct.pack(indexformat, *e)

307

308

transaction.add(self.datafile, e[0])

308

transaction.add(self.datafile, e[0])

309

self.opener(self.datafile, "a").write(data)

309

self.opener(self.datafile, "a").write(data)

310

transaction.add(self.indexfile, n * len(entry))

310

transaction.add(self.indexfile, n * len(entry))

311

self.opener(self.indexfile, "a").write(entry)

311

self.opener(self.indexfile, "a").write(entry)

312

313

self.cache = (node, n, text)

313

self.cache = (node, n, text)

314

return node

314

return node

315

316

def ancestor(self, a, b):

316

def ancestor(self, a, b):

317

# calculate the distance of every node from root

317

# calculate the distance of every node from root

318

dist = {nullid: 0}

318

dist = {nullid: 0}

319

for i in xrange(self.count()):

319

for i in xrange(self.count()):

320

n = self.node(i)

320

n = self.node(i)

321

p1, p2 = self.parents(n)

321

p1, p2 = self.parents(n)

322

dist[n] = max(dist[p1], dist[p2]) + 1

322

dist[n] = max(dist[p1], dist[p2]) + 1

323

324

# traverse ancestors in order of decreasing distance from root

324

# traverse ancestors in order of decreasing distance from root

325

def ancestors(node):

325

def ancestors(node):

326

# we store negative distances because heap returns smallest member

326

# we store negative distances because heap returns smallest member

327

h = [(-dist[node], node)]

327

h = [(-dist[node], node)]

328

seen = {}

328

seen = {}

329

earliest = self.count()

329

earliest = self.count()

330

while h:

330

while h:

331

d, n = heapq.heappop(h)

331

d, n = heapq.heappop(h)

332

if n not in seen:

332

if n not in seen:

333

seen[n] = 1

333

seen[n] = 1

334

r = self.rev(n)

334

r = self.rev(n)

335

yield (-d, r, n)

335

yield (-d, r, n)

336

for p in self.parents(n):

336

for p in self.parents(n):

337

heapq.heappush(h, (-dist[p], p))

337

heapq.heappush(h, (-dist[p], p))

338

339

x = ancestors(a)

339

x = ancestors(a)

340

y = ancestors(b)

340

y = ancestors(b)

341

lx = x.next()

341

lx = x.next()

342

ly = y.next()

342

ly = y.next()

343

344

# increment each ancestor list until it is closer to root than

344

# increment each ancestor list until it is closer to root than

345

# the other, or they match

345

# the other, or they match

346

while 1:

346

while 1:

347

if lx == ly:

347

if lx == ly:

348

return lx[2]

348

return lx[2]

349

elif lx < ly:

349

elif lx < ly:

350

ly = y.next()

350

ly = y.next()

351

elif lx > ly:

351

elif lx > ly:

352

lx = x.next()

352

lx = x.next()

353

354

def group(self, linkmap):

354

def group(self, linkmap):

355

# given a list of changeset revs, return a set of deltas and

355

# given a list of changeset revs, return a set of deltas and

356

# metadata corresponding to nodes. the first delta is

356

# metadata corresponding to nodes. the first delta is

357

# parent(nodes[0]) -> nodes[0] the receiver is guaranteed to

357

# parent(nodes[0]) -> nodes[0] the receiver is guaranteed to

358

# have this parent as it has all history before these

358

# have this parent as it has all history before these

359

# changesets. parent is parent[0]

359

# changesets. parent is parent[0]

360

361

revs = []

361

revs = []

362

needed = {}

362

needed = {}

363

364

# find file nodes/revs that match changeset revs

364

# find file nodes/revs that match changeset revs

365

for i in xrange(0, self.count()):

365

for i in xrange(0, self.count()):

366

if self.index[i][3] in linkmap:

366

if self.index[i][3] in linkmap:

367

revs.append(i)

367

revs.append(i)

368

needed[i] = 1

368

needed[i] = 1

369

370

# if we don't have any revisions touched by these changesets, bail

370

# if we don't have any revisions touched by these changesets, bail

371

if not revs:

371

if not revs:

372

yield struct.pack(">l", 0)

372

yield struct.pack(">l", 0)

373

return

373

return

374

375

# add the parent of the first rev

375

# add the parent of the first rev

376

p = self.parents(self.node(revs[0]))[0]

376

p = self.parents(self.node(revs[0]))[0]

377

revs.insert(0, self.rev(p))

377

revs.insert(0, self.rev(p))

378

379

# for each delta that isn't contiguous in the log, we need to

379

# for each delta that isn't contiguous in the log, we need to

380

# reconstruct the base, reconstruct the result, and then

380

# reconstruct the base, reconstruct the result, and then

381

# calculate the delta. We also need to do this where we've

381

# calculate the delta. We also need to do this where we've

382

# stored a full version and not a delta

382

# stored a full version and not a delta

383

for i in xrange(0, len(revs) - 1):

383

for i in xrange(0, len(revs) - 1):

384

a, b = revs[i], revs[i + 1]

384

a, b = revs[i], revs[i + 1]

385

if a + 1 != b or self.base(b) == b:

385

if a + 1 != b or self.base(b) == b:

386

for j in xrange(self.base(a), a + 1):

386

for j in xrange(self.base(a), a + 1):

387

needed[j] = 1

387

needed[j] = 1

388

for j in xrange(self.base(b), b + 1):

388

for j in xrange(self.base(b), b + 1):

389

needed[j] = 1

389

needed[j] = 1

390

391

# calculate spans to retrieve from datafile

391

# calculate spans to retrieve from datafile

392

needed = needed.keys()

392

needed = needed.keys()

393

needed.sort()

393

needed.sort()

394

spans = []

394

spans = []

395

oo = -1

395

oo = -1

396

ol = 0

396

ol = 0

397

for n in needed:

397

for n in needed:

398

if n < 0: continue

398

if n < 0: continue

399

o = self.start(n)

399

o = self.start(n)

400

l = self.length(n)

400

l = self.length(n)

401

if oo + ol == o: # can we merge with the previous?

401

if oo + ol == o: # can we merge with the previous?

402

nl = spans[-1][2]

402

nl = spans[-1][2]

403

nl.append((n, l))

403

nl.append((n, l))

404

ol += l

404

ol += l

405

spans[-1] = (oo, ol, nl)

405

spans[-1] = (oo, ol, nl)

406

else:

406

else:

407

oo = o

407

oo = o

408

ol = l

408

ol = l

409

spans.append((oo, ol, [(n, l)]))

409

spans.append((oo, ol, [(n, l)]))

410

411

# read spans in, divide up chunks

411

# read spans in, divide up chunks

412

chunks = {}

412

chunks = {}

413

for span in spans:

413

for span in spans:

414

# we reopen the file for each span to make http happy for now

414

# we reopen the file for each span to make http happy for now

415

f = self.opener(self.datafile)

415

f = self.opener(self.datafile)

416

f.seek(span[0])

416

f.seek(span[0])

417

data = f.read(span[1])

417

data = f.read(span[1])

418

419

# divide up the span

419

# divide up the span

420

pos = 0

420

pos = 0

421

for r, l in span[2]:

421

for r, l in span[2]:

422

chunks[r] = decompress(data[pos: pos + l])

422

chunks[r] = decompress(data[pos: pos + l])

423

pos += l

423

pos += l

424

425

# helper to reconstruct intermediate versions

425

# helper to reconstruct intermediate versions

426

def construct(text, base, rev):

426

def construct(text, base, rev):

427

bins = [chunks[r] for r in xrange(base + 1, rev + 1)]

427

bins = [chunks[r] for r in xrange(base + 1, rev + 1)]

428

return mdiff.patches(text, bins)

428

return mdiff.patches(text, bins)

429

430

# build deltas

430

# build deltas

431

deltas = []

431

deltas = []

432

for d in xrange(0, len(revs) - 1):

432

for d in xrange(0, len(revs) - 1):

433

a, b = revs[d], revs[d + 1]

433

a, b = revs[d], revs[d + 1]

434

n = self.node(b)

434

n = self.node(b)

435

436

# do we need to construct a new delta?

436

# do we need to construct a new delta?

437

if a + 1 != b or self.base(b) == b:

437

if a + 1 != b or self.base(b) == b:

438

if a >= 0:

438

if a >= 0:

439

base = self.base(a)

439

base = self.base(a)

440

ta = chunks[self.base(a)]

440

ta = chunks[self.base(a)]

441

ta = construct(ta, base, a)

441

ta = construct(ta, base, a)

442

else:

442

else:

443

ta = ""

443

ta = ""

444

445

base = self.base(b)

445

base = self.base(b)

446

if a > base:

446

if a > base:

447

base = a

447

base = a

448

tb = ta

448

tb = ta

449

else:

449

else:

450

tb = chunks[self.base(b)]

450

tb = chunks[self.base(b)]

451

tb = construct(tb, base, b)

451

tb = construct(tb, base, b)

452

d = self.diff(ta, tb)

452

d = self.diff(ta, tb)

453

else:

453

else:

454

d = chunks[b]

454

d = chunks[b]

455

456

p = self.parents(n)

456

p = self.parents(n)

457

meta = n + p[0] + p[1] + linkmap[self.linkrev(n)]

457

meta = n + p[0] + p[1] + linkmap[self.linkrev(n)]

458

l = struct.pack(">l", len(meta) + len(d) + 4)

458

l = struct.pack(">l", len(meta) + len(d) + 4)

459

yield l

459

yield l

460

yield meta

460

yield meta

461

yield d

461

yield d

462

463

yield struct.pack(">l", 0)

463

yield struct.pack(">l", 0)

464

465

def addgroup(self, revs, linkmapper, transaction, unique = 0):

465

def addgroup(self, revs, linkmapper, transaction, unique = 0):

466

# given a set of deltas, add them to the revision log. the

466

# given a set of deltas, add them to the revision log. the

467

# first delta is against its parent, which should be in our

467

# first delta is against its parent, which should be in our

468

# log, the rest are against the previous delta.

468

# log, the rest are against the previous delta.

469

470

# track the base of the current delta log

470

# track the base of the current delta log

471

r = self.count()

471

r = self.count()

472

t = r - 1

472

t = r - 1

473

node = nullid

473

node = nullid

474

475

base = prev = -1

475

base = prev = -1

476

start = end = 0

476

start = end = 0

477

if r:

477

if r:

478

start = self.start(self.base(t))

478

start = self.start(self.base(t))

479

end = self.end(t)

479

end = self.end(t)

480

measure = self.length(self.base(t))

480

measure = self.length(self.base(t))

481

base = self.base(t)

481

base = self.base(t)

482

prev = self.tip()

482

prev = self.tip()

483

484

transaction.add(self.datafile, end)

484

transaction.add(self.datafile, end)

485

transaction.add(self.indexfile, r * struct.calcsize(indexformat))

485

transaction.add(self.indexfile, r * struct.calcsize(indexformat))

486

dfh = self.opener(self.datafile, "a")

486

dfh = self.opener(self.datafile, "a")

487

ifh = self.opener(self.indexfile, "a")

487

ifh = self.opener(self.indexfile, "a")

488

489

# loop through our set of deltas

489

# loop through our set of deltas

490

chain = None

490

chain = None

491

for chunk in revs:

491

for chunk in revs:

492

node, p1, p2, cs = struct.unpack("20s20s20s20s", chunk[:80])

492

node, p1, p2, cs = struct.unpack("20s20s20s20s", chunk[:80])

493

link = linkmapper(cs)

493

link = linkmapper(cs)

494

if node in self.nodemap:

494

if node in self.nodemap:

495

# this can happen if two branches make the same change

495

# this can happen if two branches make the same change

496

if unique:

496

if unique:

497

raise "already have %s" % hex(node[:4])

497

raise "already have %s" % hex(node[:4])

498

continue

498

continue

499

delta = chunk[80:]

499

delta = chunk[80:]

500

501

if not chain:

501

if not chain:

502

# retrieve the parent revision of the delta chain

502

# retrieve the parent revision of the delta chain

503

chain = p1

503

chain = p1

504

if not chain in self.nodemap:

504

if not chain in self.nodemap:

505

raise "unknown base %s" % short(chain[:4])

505

raise "unknown base %s" % short(chain[:4])

506

507

# full versions are inserted when the needed deltas become

507

# full versions are inserted when the needed deltas become

508

# comparable to the uncompressed text or when the previous

508

# comparable to the uncompressed text or when the previous

509

# version is not the one we have a delta against. We use

509

# version is not the one we have a delta against. We use

510

# the size of the previous full rev as a proxy for the

510

# the size of the previous full rev as a proxy for the

511

# current size.

511

# current size.

512

513

if chain == prev:

513

if chain == prev:

514

cdelta = compress(delta)

514

cdelta = compress(delta)

515

516

if chain != prev or (end - start + len(cdelta)) > measure * 2:

516

if chain != prev or (end - start + len(cdelta)) > measure * 2:

517

# flush our writes here so we can read it in revision

517

# flush our writes here so we can read it in revision

518

dfh.flush()

518

dfh.flush()

519

ifh.flush()

519

ifh.flush()

520

text = self.revision(chain)

520

text = self.revision(chain)

521

text = self.patches(text, [delta])

521

text = self.patches(text, [delta])

522

chk = self.addrevision(text, transaction, link, p1, p2)

522

chk = self.addrevision(text, transaction, link, p1, p2)

523

if chk != node:

523

if chk != node:

524

raise "consistency error adding group"

524

raise "consistency error adding group"

525

measure = len(text)

525

measure = len(text)

526

else:

526

else:

527

e = (end, len(cdelta), self.base(t), link, p1, p2, node)

527

e = (end, len(cdelta), self.base(t), link, p1, p2, node)

528

self.index.append(e)

528

self.index.append(e)

529

self.nodemap[node] = r

529

self.nodemap[node] = r

530

dfh.write(cdelta)

530

dfh.write(cdelta)

531

ifh.write(struct.pack(indexformat, *e))

531

ifh.write(struct.pack(indexformat, *e))

532

533

t, r, chain, prev = r, r + 1, node, node

533

t, r, chain, prev = r, r + 1, node, node

534

start = self.start(self.base(t))

534

start = self.start(self.base(t))

535

end = self.end(t)

535

end = self.end(t)

536

537

dfh.close()

537

dfh.close()

538

ifh.close()

538

ifh.close()

539

return node

539

return node

	Site-wide shortcuts
/	Use quick search box
g h	Goto home page
g g	Goto my private gists page
g G	Goto my public gists page
g 0-9	Goto bookmarked items from 0-9
n r	New repository page
n g	New gist page

	Repositories
g s	Goto summary page
g c	Goto changelog page
g f	Goto files page
g F	Goto files page with file search activated
g p	Goto pull requests page
g o	Goto repository settings
g O	Goto repository access permissions settings
t s	Toggle sidebar on some pages

             # revlog.py - storage back-end for mercurial
             #
             # This provides efficient delta storage with O(1) retrieve and append
             # and O(changes) merge between branches
             #
             # Copyright 2005 Matt Mackall <mpm@selenic.com>
             #
             # This software may be used and distributed according to the terms
             # of the GNU General Public License, incorporated herein by reference.
             import zlib, struct, sha, binascii, heapq
             from mercurial import mdiff
             def hex(node): return binascii.hexlify(node)
             def bin(node): return binascii.unhexlify(node)
             def short(node): return hex(node[:6])
             def compress(text):
                 if not text: return text
                 if len(text) < 44:
                     if text[0] == '\0': return text
                     return 'u' + text
                 bin = zlib.compress(text)
                 if len(bin) > len(text):
                     if text[0] == '\0': return text
                     return 'u' + text
                 return bin
             def decompress(bin):
                 if not bin: return bin
                 t = bin[0]
                 if t == '\0': return bin
                 if t == 'x': return zlib.decompress(bin)
                 if t == 'u': return bin[1:]
                 raise "unknown compression type %s" % t
             def hash(text, p1, p2):
                 l = [p1, p2]
                 l.sort()
                 return sha.sha(l[0] + l[1] + text).digest()
             nullid = "\0" * 20
             indexformat = ">4l20s20s20s"
             class lazyparser:
                 def __init__(self, data, revlog):
                     self.data = data
                     self.s = struct.calcsize(indexformat)
                     self.l = len(data)/self.s
                     self.index = [None] * self.l
                     self.map = {nullid: -1}
                     self.all = 0
                     self.revlog = revlog
                 def load(self, pos=None):
                     if self.all: return
                     if pos is not None:
                         block = pos / 1000
                         i = block * 1000
                         end = min(self.l, i + 1000)
                     else:
                         self.all = 1
                         i = 0
                         end = self.l
                         self.revlog.index = self.index
                         self.revlog.nodemap = self.map
                     while i < end:
                         d = self.data[i * self.s: (i + 1) * self.s]
                         e = struct.unpack(indexformat, d)
                         self.index[i] = e
                         self.map[e[6]] = i
                         i += 1
             class lazyindex:
                 def __init__(self, parser):
                     self.p = parser
                 def __len__(self):
                     return len(self.p.index)
                 def load(self, pos):
                     self.p.load(pos)
                     return self.p.index[pos]
                 def __getitem__(self, pos):
                     return self.p.index[pos] or self.load(pos)
                 def append(self, e):
                     self.p.index.append(e)
             class lazymap:
                 def __init__(self, parser):
                     self.p = parser
                 def load(self, key):
                     if self.p.all: return
                     n = self.p.data.find(key)
                     if n < 0: raise KeyError("node " + hex(key))
                     pos = n / self.p.s
                     self.p.load(pos)
                 def __contains__(self, key):
                     self.p.load()
                     return key in self.p.map
                 def __iter__(self):
                     yield nullid
                     for i in xrange(self.p.l):
                         try:
                             yield self.p.index[i][6]
                         except:
                             self.p.load(i)
                             yield self.p.index[i][6]
                 def __getitem__(self, key):
                     try:
                         return self.p.map[key]
                     except KeyError:
                         try:
                             self.load(key)
                             return self.p.map[key]
                         except KeyError:
                             raise KeyError("node " + hex(key))
                 def __setitem__(self, key, val):
                     self.p.map[key] = val
             class revlog:
                 def __init__(self, opener, indexfile, datafile):
                     self.indexfile = indexfile
                     self.datafile = datafile
                     self.opener = opener
                     self.cache = None
                     try:
                         i = self.opener(self.indexfile).read()
                     except IOError:
                         i = ""
                     if len(i) > 10000:
                         # big index, let's parse it on demand
                         parser = lazyparser(i, self)
                         self.index = lazyindex(parser)
                         self.nodemap = lazymap(parser)
                     else:
                         s = struct.calcsize(indexformat)
                         l = len(i) / s
                         self.index = [None] * l
                         m = [None] * l
                         n = 0
                         for f in xrange(0, len(i), s):
                             # offset, size, base, linkrev, p1, p2, nodeid
                             e = struct.unpack(indexformat, i[f:f + s])
                             m[n] = (e[6], n)
                             self.index[n] = e
                             n += 1
                         self.nodemap = dict(m)
                         self.nodemap[nullid] = -1
                 def tip(self): return self.node(len(self.index) - 1)
                 def count(self): return len(self.index)
                 def node(self, rev): return (rev < 0) and nullid or self.index[rev][6]
                 def rev(self, node): return self.nodemap[node]
                 def linkrev(self, node): return self.index[self.nodemap[node]][3]
                 def parents(self, node):
                     if node == nullid: return (nullid, nullid)
                     return self.index[self.nodemap[node]][4:6]
                 def start(self, rev): return self.index[rev][0]
                 def length(self, rev): return self.index[rev][1]
                 def end(self, rev): return self.start(rev) + self.length(rev)
                 def base(self, rev): return self.index[rev][2]
                 def heads(self):
                     p = {}
                     h = []
                     for r in range(self.count() - 1, -1, -1):
                         n = self.node(r)
                         if n not in p:
                             h.append(n)
                         for pn in self.parents(n):
                             p[pn] = 1
                     return h
                 def children(self, node):
                     c = []
                     p = self.rev(node)
                     for r in range(p + 1, self.count()):
                         n = self.node(r)
                         for pn in self.parents(n):
                             if pn == p:
                                 c.append(p)
                                 continue
                             elif pn == nullid:
                                 continue
                     return c
                 def lookup(self, id):
                     try:
                         rev = int(id)
                         if str(rev) != id: raise ValueError
                         if rev < 0: rev = self.count() + rev
-                        if rev < 0 or rev >= self.count: raise ValueError
+                        if rev < 0 or rev >= self.count(): raise ValueError
                         return self.node(rev)
                     except (ValueError, OverflowError):
                         c = []
                         for n in self.nodemap:
                             if hex(n).startswith(id):
                                 c.append(n)
                         if len(c) > 1: raise KeyError("Ambiguous identifier")
                         if len(c) < 1: raise KeyError("No match found")
                         return c[0]
                     return None
                 def diff(self, a, b):
                     return mdiff.textdiff(a, b)
                 def patches(self, t, pl):
                     return mdiff.patches(t, pl)
                 def delta(self, node):
                     r = self.rev(node)
                     b = self.base(r)
                     if r == b:
                         return self.diff(self.revision(self.node(r - 1)),
                                          self.revision(node))
                     else:
                         f = self.opener(self.datafile)
                         f.seek(self.start(r))
                         data = f.read(self.length(r))
                     return decompress(data)
                 def revision(self, node):
                     if node == nullid: return ""
                     if self.cache and self.cache[0] == node: return self.cache[2]
                     text = None
                     rev = self.rev(node)
                     start, length, base, link, p1, p2, node = self.index[rev]
                     end = start + length
                     if base != rev: start = self.start(base)
                     if self.cache and self.cache[1] >= base and self.cache[1] < rev:
                         base = self.cache[1]
                         start = self.start(base + 1)
                         text = self.cache[2]
                         last = 0
                     f = self.opener(self.datafile)
                     f.seek(start)
                     data = f.read(end - start)
                     if not text:
                         last = self.length(base)
                         text = decompress(data[:last])
                     bins = []
                     for r in xrange(base + 1, rev + 1):
                         s = self.length(r)
                         bins.append(decompress(data[last:last + s]))
                         last = last + s
                     text = mdiff.patches(text, bins)
                     if node != hash(text, p1, p2):
                         raise IOError("integrity check failed on %s:%d"
                                       % (self.datafile, rev))
                     self.cache = (node, rev, text)
                     return text
                 def addrevision(self, text, transaction, link, p1=None, p2=None):
                     if text is None: text = ""
                     if p1 is None: p1 = self.tip()
                     if p2 is None: p2 = nullid
                     node = hash(text, p1, p2)
                     if node in self.nodemap:
                         return node
                     n = self.count()
                     t = n - 1
                     if n:
                         base = self.base(t)
                         start = self.start(base)
                         end = self.end(t)
                         prev = self.revision(self.tip())
                         d = self.diff(prev, text)
                         data = compress(d)
                         dist = end - start + len(data)
                     # full versions are inserted when the needed deltas
                     # become comparable to the uncompressed text
                     if not n or dist > len(text) * 2:
                         data = compress(text)
                         base = n
                     else:
                         base = self.base(t)
                     offset = 0
                     if t >= 0:
                         offset = self.end(t)
                     e = (offset, len(data), base, link, p1, p2, node)
                     self.index.append(e)
                     self.nodemap[node] = n
                     entry = struct.pack(indexformat, *e)
                     transaction.add(self.datafile, e[0])
                     self.opener(self.datafile, "a").write(data)
                     transaction.add(self.indexfile, n * len(entry))
                     self.opener(self.indexfile, "a").write(entry)
                     self.cache = (node, n, text)
                     return node
                 def ancestor(self, a, b):
                     # calculate the distance of every node from root
                     dist = {nullid: 0}
                     for i in xrange(self.count()):
                         n = self.node(i)
                         p1, p2 = self.parents(n)
                         dist[n] = max(dist[p1], dist[p2]) + 1
                     # traverse ancestors in order of decreasing distance from root
                     def ancestors(node):
                         # we store negative distances because heap returns smallest member
                         h = [(-dist[node], node)]
                         seen = {}
                         earliest = self.count()
                         while h:
                             d, n = heapq.heappop(h)
                             if n not in seen:
                                 seen[n] = 1
                                 r = self.rev(n)
                                 yield (-d, r, n)
                                 for p in self.parents(n):
                                     heapq.heappush(h, (-dist[p], p))
                     x = ancestors(a)
                     y = ancestors(b)
                     lx = x.next()
                     ly = y.next()
                     # increment each ancestor list until it is closer to root than
                     # the other, or they match
                     while 1:
                         if lx == ly:
                             return lx[2]
                         elif lx < ly:
                             ly = y.next()
                         elif lx > ly:
                             lx = x.next()
                 def group(self, linkmap):
                     # given a list of changeset revs, return a set of deltas and
                     # metadata corresponding to nodes. the first delta is
                     # parent(nodes[0]) -> nodes[0] the receiver is guaranteed to
                     # have this parent as it has all history before these
                     # changesets. parent is parent[0]
                     revs = []
                     needed = {}
                     # find file nodes/revs that match changeset revs
                     for i in xrange(0, self.count()):
                         if self.index[i][3] in linkmap:
                             revs.append(i)
                             needed[i] = 1
                     # if we don't have any revisions touched by these changesets, bail
                     if not revs:
                         yield struct.pack(">l", 0)
                         return
                     # add the parent of the first rev
                     p = self.parents(self.node(revs[0]))[0]
                     revs.insert(0, self.rev(p))
                     # for each delta that isn't contiguous in the log, we need to
                     # reconstruct the base, reconstruct the result, and then
                     # calculate the delta. We also need to do this where we've
                     # stored a full version and not a delta
                     for i in xrange(0, len(revs) - 1):
                         a, b = revs[i], revs[i + 1]
                         if a + 1 != b or self.base(b) == b:
                             for j in xrange(self.base(a), a + 1):
                                 needed[j] = 1
                             for j in xrange(self.base(b), b + 1):
                                 needed[j] = 1
                     # calculate spans to retrieve from datafile
                     needed = needed.keys()
                     needed.sort()
                     spans = []
                     oo = -1
                     ol = 0
                     for n in needed:
                         if n < 0: continue
                         o = self.start(n)
                         l = self.length(n)
                         if oo + ol == o: # can we merge with the previous?
                             nl = spans[-1][2]
                             nl.append((n, l))
                             ol += l
                             spans[-1] = (oo, ol, nl)
                         else:
                             oo = o
                             ol = l
                             spans.append((oo, ol, [(n, l)]))
                     # read spans in, divide up chunks
                     chunks = {}
                     for span in spans:
                         # we reopen the file for each span to make http happy for now
                         f = self.opener(self.datafile)
                         f.seek(span[0])
                         data = f.read(span[1])
                         # divide up the span
                         pos = 0
                         for r, l in span[2]:
                             chunks[r] = decompress(data[pos: pos + l])
                             pos += l
                     # helper to reconstruct intermediate versions
                     def construct(text, base, rev):
                         bins = [chunks[r] for r in xrange(base + 1, rev + 1)]
                         return mdiff.patches(text, bins)
                     # build deltas
                     deltas = []
                     for d in xrange(0, len(revs) - 1):
                         a, b = revs[d], revs[d + 1]
                         n = self.node(b)
                         # do we need to construct a new delta?
                         if a + 1 != b or self.base(b) == b:
                             if a >= 0:
                                 base = self.base(a)
                                 ta = chunks[self.base(a)]
                                 ta = construct(ta, base, a)
                             else:
                                 ta = ""
                             base = self.base(b)
                             if a > base:
                                 base = a
                                 tb = ta
                             else:
                                 tb = chunks[self.base(b)]
                             tb = construct(tb, base, b)
                             d = self.diff(ta, tb)
                         else:
                             d = chunks[b]
                         p = self.parents(n)
                         meta = n + p[0] + p[1] + linkmap[self.linkrev(n)]
                         l = struct.pack(">l", len(meta) + len(d) + 4)
                         yield l
                         yield meta
                         yield d
                     yield struct.pack(">l", 0)
                 def addgroup(self, revs, linkmapper, transaction, unique = 0):
                     # given a set of deltas, add them to the revision log. the
                     # first delta is against its parent, which should be in our
                     # log, the rest are against the previous delta.
                     # track the base of the current delta log
                     r = self.count()
                     t = r - 1
                     node = nullid
                     base = prev = -1
                     start = end = 0
                     if r:
                         start = self.start(self.base(t))
                         end = self.end(t)
                         measure = self.length(self.base(t))
                         base = self.base(t)
                         prev = self.tip()
                     transaction.add(self.datafile, end)
                     transaction.add(self.indexfile, r * struct.calcsize(indexformat))
                     dfh = self.opener(self.datafile, "a")
                     ifh = self.opener(self.indexfile, "a")
                     # loop through our set of deltas
                     chain = None
                     for chunk in revs:
                         node, p1, p2, cs = struct.unpack("20s20s20s20s", chunk[:80])
                         link = linkmapper(cs)
                         if node in self.nodemap:
                             # this can happen if two branches make the same change
                             if unique:
                                 raise "already have %s" % hex(node[:4])
                             continue
                         delta = chunk[80:]
                         if not chain:
                             # retrieve the parent revision of the delta chain
                             chain = p1
                             if not chain in self.nodemap:
                                 raise "unknown base %s" % short(chain[:4])
                         # full versions are inserted when the needed deltas become
                         # comparable to the uncompressed text or when the previous
                         # version is not the one we have a delta against. We use
                         # the size of the previous full rev as a proxy for the
                         # current size.
                         if chain == prev:
                             cdelta = compress(delta)
                         if chain != prev or (end - start + len(cdelta)) > measure * 2:
                             # flush our writes here so we can read it in revision
                             dfh.flush()
                             ifh.flush()
                             text = self.revision(chain)
                             text = self.patches(text, [delta])
                             chk = self.addrevision(text, transaction, link, p1, p2)
                             if chk != node:
                                 raise "consistency error adding group"
                             measure = len(text)
                         else:
                             e = (end, len(cdelta), self.base(t), link, p1, p2, node)
                             self.index.append(e)
                             self.nodemap[node] = r
                             dfh.write(cdelta)
                             ifh.write(struct.pack(indexformat, *e))
                         t, r, chain, prev = r, r + 1, node, node
                         start = self.start(self.base(t))
                         end = self.end(t)
                     dfh.close()
                     ifh.close()
                     return node