upstream/mercurial-mirror Commit - r373:67081329

1

# revlog.py - storage back-end for mercurial

1

# revlog.py - storage back-end for mercurial

2

#

2

#

3

# This provides efficient delta storage with O(1) retrieve and append

3

# This provides efficient delta storage with O(1) retrieve and append

4

# and O(changes) merge between branches

4

# and O(changes) merge between branches

5

#

5

#

6

7

#

7

#

8

# This software may be used and distributed according to the terms

8

# This software may be used and distributed according to the terms

9

# of the GNU General Public License, incorporated herein by reference.

9

# of the GNU General Public License, incorporated herein by reference.

10

11

import zlib, struct, sha, binascii, heapq

11

import zlib, struct, sha, binascii, heapq

12

from mercurial import mdiff

12

from mercurial import mdiff

13

14

def hex(node): return binascii.hexlify(node)

14

def hex(node): return binascii.hexlify(node)

15

def bin(node): return binascii.unhexlify(node)

15

def bin(node): return binascii.unhexlify(node)

16

def short(node): return hex(node[:4])

16

def short(node): return hex(node[:6])

17

18

def compress(text):

18

def compress(text):

19

if not text: return text

19

if not text: return text

20

if len(text) < 44:

20

if len(text) < 44:

21

if text[0] == '\0': return text

21

if text[0] == '\0': return text

22

return 'u' + text

22

return 'u' + text

23

bin = zlib.compress(text)

23

bin = zlib.compress(text)

24

if len(bin) > len(text):

24

if len(bin) > len(text):

25

if text[0] == '\0': return text

25

if text[0] == '\0': return text

26

return 'u' + text

26

return 'u' + text

27

return bin

27

return bin

28

29

def decompress(bin):

29

def decompress(bin):

30

if not bin: return bin

30

if not bin: return bin

31

t = bin[0]

31

t = bin[0]

32

if t == '\0': return bin

32

if t == '\0': return bin

33

if t == 'x': return zlib.decompress(bin)

33

if t == 'x': return zlib.decompress(bin)

34

if t == 'u': return bin[1:]

34

if t == 'u': return bin[1:]

35

raise "unknown compression type %s" % t

35

raise "unknown compression type %s" % t

36

37

def hash(text, p1, p2):

37

def hash(text, p1, p2):

38

l = [p1, p2]

38

l = [p1, p2]

39

l.sort()

39

l.sort()

40

return sha.sha(l[0] + l[1] + text).digest()

40

return sha.sha(l[0] + l[1] + text).digest()

41

42

nullid = "\0" * 20

42

nullid = "\0" * 20

43

indexformat = ">4l20s20s20s"

43

indexformat = ">4l20s20s20s"

44

45

class lazyparser:

45

class lazyparser:

46

def __init__(self, data, revlog):

46

def __init__(self, data, revlog):

47

self.data = data

47

self.data = data

48

self.s = struct.calcsize(indexformat)

48

self.s = struct.calcsize(indexformat)

49

self.l = len(data)/self.s

49

self.l = len(data)/self.s

50

self.index = [None] * self.l

50

self.index = [None] * self.l

51

self.map = {nullid: -1}

51

self.map = {nullid: -1}

52

self.all = 0

52

self.all = 0

53

self.revlog = revlog

53

self.revlog = revlog

54

55

def load(self, pos=None):

55

def load(self, pos=None):

56

if self.all: return

56

if self.all: return

57

if pos is not None:

57

if pos is not None:

58

block = pos / 1000

58

block = pos / 1000

59

i = block * 1000

59

i = block * 1000

60

end = min(self.l, i + 1000)

60

end = min(self.l, i + 1000)

61

else:

61

else:

62

self.all = 1

62

self.all = 1

63

i = 0

63

i = 0

64

end = self.l

64

end = self.l

65

self.revlog.index = self.index

65

self.revlog.index = self.index

66

self.revlog.nodemap = self.map

66

self.revlog.nodemap = self.map

67

68

while i < end:

68

while i < end:

69

d = self.data[i * self.s: (i + 1) * self.s]

69

d = self.data[i * self.s: (i + 1) * self.s]

70

e = struct.unpack(indexformat, d)

70

e = struct.unpack(indexformat, d)

71

self.index[i] = e

71

self.index[i] = e

72

self.map[e[6]] = i

72

self.map[e[6]] = i

73

i += 1

73

i += 1

74

75

class lazyindex:

75

class lazyindex:

76

def __init__(self, parser):

76

def __init__(self, parser):

77

self.p = parser

77

self.p = parser

78

def __len__(self):

78

def __len__(self):

79

return len(self.p.index)

79

return len(self.p.index)

80

def load(self, pos):

80

def load(self, pos):

81

self.p.load(pos)

81

self.p.load(pos)

82

return self.p.index[pos]

82

return self.p.index[pos]

83

def __getitem__(self, pos):

83

def __getitem__(self, pos):

84

return self.p.index[pos] or self.load(pos)

84

return self.p.index[pos] or self.load(pos)

85

def append(self, e):

85

def append(self, e):

86

self.p.index.append(e)

86

self.p.index.append(e)

87

88

class lazymap:

88

class lazymap:

89

def __init__(self, parser):

89

def __init__(self, parser):

90

self.p = parser

90

self.p = parser

91

def load(self, key):

91

def load(self, key):

92

if self.p.all: return

92

if self.p.all: return

93

n = self.p.data.find(key)

93

n = self.p.data.find(key)

94

if n < 0: raise KeyError("node " + hex(key))

94

if n < 0: raise KeyError("node " + hex(key))

95

pos = n / self.p.s

95

pos = n / self.p.s

96

self.p.load(pos)

96

self.p.load(pos)

97

def __contains__(self, key):

97

def __contains__(self, key):

98

self.p.load()

98

self.p.load()

99

return key in self.p.map

99

return key in self.p.map

100

def __iter__(self):

100

def __iter__(self):

101

for i in xrange(self.p.l):

101

for i in xrange(self.p.l):

102

try:

102

try:

103

yield self.p.index[i][6]

103

yield self.p.index[i][6]

104

except:

104

except:

105

self.p.load(i)

105

self.p.load(i)

106

yield self.p.index[i][6]

106

yield self.p.index[i][6]

107

def __getitem__(self, key):

107

def __getitem__(self, key):

108

try:

108

try:

109

return self.p.map[key]

109

return self.p.map[key]

110

except KeyError:

110

except KeyError:

111

try:

111

try:

112

self.load(key)

112

self.load(key)

113

return self.p.map[key]

113

return self.p.map[key]

114

except KeyError:

114

except KeyError:

115

raise KeyError("node " + hex(key))

115

raise KeyError("node " + hex(key))

116

def __setitem__(self, key, val):

116

def __setitem__(self, key, val):

117

self.p.map[key] = val

117

self.p.map[key] = val

118

119

class revlog:

119

class revlog:

120

def __init__(self, opener, indexfile, datafile):

120

def __init__(self, opener, indexfile, datafile):

121

self.indexfile = indexfile

121

self.indexfile = indexfile

122

self.datafile = datafile

122

self.datafile = datafile

123

self.opener = opener

123

self.opener = opener

124

self.cache = None

124

self.cache = None

125

126

try:

126

try:

127

i = self.opener(self.indexfile).read()

127

i = self.opener(self.indexfile).read()

128

except IOError:

128

except IOError:

129

i = ""

129

i = ""

130

131

if len(i) > 10000:

131

if len(i) > 10000:

132

# big index, let's parse it on demand

132

# big index, let's parse it on demand

133

parser = lazyparser(i, self)

133

parser = lazyparser(i, self)

134

self.index = lazyindex(parser)

134

self.index = lazyindex(parser)

135

self.nodemap = lazymap(parser)

135

self.nodemap = lazymap(parser)

136

else:

136

else:

137

s = struct.calcsize(indexformat)

137

s = struct.calcsize(indexformat)

138

l = len(i) / s

138

l = len(i) / s

139

self.index = [None] * l

139

self.index = [None] * l

140

m = [None] * l

140

m = [None] * l

141

142

n = 0

142

n = 0

143

for f in xrange(0, len(i), s):

143

for f in xrange(0, len(i), s):

144

# offset, size, base, linkrev, p1, p2, nodeid

144

# offset, size, base, linkrev, p1, p2, nodeid

145

e = struct.unpack(indexformat, i[f:f + s])

145

e = struct.unpack(indexformat, i[f:f + s])

146

m[n] = (e[6], n)

146

m[n] = (e[6], n)

147

self.index[n] = e

147

self.index[n] = e

148

n += 1

148

n += 1

149

150

self.nodemap = dict(m)

150

self.nodemap = dict(m)

151

self.nodemap[nullid] = -1

151

self.nodemap[nullid] = -1

152

153

154

def tip(self): return self.node(len(self.index) - 1)

154

def tip(self): return self.node(len(self.index) - 1)

155

def count(self): return len(self.index)

155

def count(self): return len(self.index)

156

def node(self, rev): return (rev < 0) and nullid or self.index[rev][6]

156

def node(self, rev): return (rev < 0) and nullid or self.index[rev][6]

157

def rev(self, node): return self.nodemap[node]

157

def rev(self, node): return self.nodemap[node]

158

def linkrev(self, node): return self.index[self.nodemap[node]][3]

158

def linkrev(self, node): return self.index[self.nodemap[node]][3]

159

def parents(self, node):

159

def parents(self, node):

160

if node == nullid: return (nullid, nullid)

160

if node == nullid: return (nullid, nullid)

161

return self.index[self.nodemap[node]][4:6]

161

return self.index[self.nodemap[node]][4:6]

162

163

def start(self, rev): return self.index[rev][0]

163

def start(self, rev): return self.index[rev][0]

164

def length(self, rev): return self.index[rev][1]

164

def length(self, rev): return self.index[rev][1]

165

def end(self, rev): return self.start(rev) + self.length(rev)

165

def end(self, rev): return self.start(rev) + self.length(rev)

166

def base(self, rev): return self.index[rev][2]

166

def base(self, rev): return self.index[rev][2]

167

168

def heads(self):

168

def heads(self):

169

p = {}

169

p = {}

170

h = []

170

h = []

171

for r in range(self.count() - 1, -1, -1):

171

for r in range(self.count() - 1, -1, -1):

172

n = self.node(r)

172

n = self.node(r)

173

if n not in p:

173

if n not in p:

174

h.append(n)

174

h.append(n)

175

for pn in self.parents(n):

175

for pn in self.parents(n):

176

p[pn] = 1

176

p[pn] = 1

177

return h

177

return h

178

179

def children(self, node):

179

def children(self, node):

180

c = []

180

c = []

181

p = self.rev(node)

181

p = self.rev(node)

182

for r in range(p + 1, self.count()):

182

for r in range(p + 1, self.count()):

183

n = self.node(r)

183

n = self.node(r)

184

for pn in self.parents(n):

184

for pn in self.parents(n):

185

if pn == p:

185

if pn == p:

186

c.append(p)

186

c.append(p)

187

continue

187

continue

188

elif pn == nullid:

188

elif pn == nullid:

189

continue

189

continue

190

return c

190

return c

191

192

def lookup(self, id):

192

def lookup(self, id):

193

try:

193

try:

194

rev = int(id)

194

rev = int(id)

195

return self.node(rev)

195

return self.node(rev)

196

except ValueError:

196

except ValueError:

197

c = []

197

c = []

198

for n in self.nodemap:

198

for n in self.nodemap:

199

if id in hex(n):

199

if id in hex(n):

200

c.append(n)

200

c.append(n)

201

if len(c) > 1: raise KeyError("Ambiguous identifier")

201

if len(c) > 1: raise KeyError("Ambiguous identifier")

202

if len(c) < 1: raise KeyError("No match found")

202

if len(c) < 1: raise KeyError("No match found")

203

return c[0]

203

return c[0]

204

205

return None

205

return None

206

207

def diff(self, a, b):

207

def diff(self, a, b):

208

return mdiff.textdiff(a, b)

208

return mdiff.textdiff(a, b)

209

210

def patches(self, t, pl):

210

def patches(self, t, pl):

211

return mdiff.patches(t, pl)

211

return mdiff.patches(t, pl)

212

213

def delta(self, node):

213

def delta(self, node):

214

r = self.rev(node)

214

r = self.rev(node)

215

b = self.base(r)

215

b = self.base(r)

216

if r == b:

216

if r == b:

217

return self.diff(self.revision(self.node(r - 1)),

217

return self.diff(self.revision(self.node(r - 1)),

218

self.revision(node))

218

self.revision(node))

219

else:

219

else:

220

f = self.opener(self.datafile)

220

f = self.opener(self.datafile)

221

f.seek(self.start(r))

221

f.seek(self.start(r))

222

data = f.read(self.length(r))

222

data = f.read(self.length(r))

223

return decompress(data)

223

return decompress(data)

224

225

def revision(self, node):

225

def revision(self, node):

226

if node == nullid: return ""

226

if node == nullid: return ""

227

if self.cache and self.cache[0] == node: return self.cache[2]

227

if self.cache and self.cache[0] == node: return self.cache[2]

228

229

text = None

229

text = None

230

rev = self.rev(node)

230

rev = self.rev(node)

231

start, length, base, link, p1, p2, node = self.index[rev]

231

start, length, base, link, p1, p2, node = self.index[rev]

232

end = start + length

232

end = start + length

233

if base != rev: start = self.start(base)

233

if base != rev: start = self.start(base)

234

235

if self.cache and self.cache[1] >= base and self.cache[1] < rev:

235

if self.cache and self.cache[1] >= base and self.cache[1] < rev:

236

base = self.cache[1]

236

base = self.cache[1]

237

start = self.start(base + 1)

237

start = self.start(base + 1)

238

text = self.cache[2]

238

text = self.cache[2]

239

last = 0

239

last = 0

240

241

f = self.opener(self.datafile)

241

f = self.opener(self.datafile)

242

f.seek(start)

242

f.seek(start)

243

data = f.read(end - start)

243

data = f.read(end - start)

244

245

if not text:

245

if not text:

246

last = self.length(base)

246

last = self.length(base)

247

text = decompress(data[:last])

247

text = decompress(data[:last])

248

249

bins = []

249

bins = []

250

for r in xrange(base + 1, rev + 1):

250

for r in xrange(base + 1, rev + 1):

251

s = self.length(r)

251

s = self.length(r)

252

bins.append(decompress(data[last:last + s]))

252

bins.append(decompress(data[last:last + s]))

253

last = last + s

253

last = last + s

254

255

text = mdiff.patches(text, bins)

255

text = mdiff.patches(text, bins)

256

257

if node != hash(text, p1, p2):

257

if node != hash(text, p1, p2):

258

raise IOError("integrity check failed on %s:%d"

258

raise IOError("integrity check failed on %s:%d"

259

% (self.datafile, rev))

259

% (self.datafile, rev))

260

261

self.cache = (node, rev, text)

261

self.cache = (node, rev, text)

262

return text

262

return text

263

264

def addrevision(self, text, transaction, link, p1=None, p2=None):

264

def addrevision(self, text, transaction, link, p1=None, p2=None):

265

if text is None: text = ""

265

if text is None: text = ""

266

if p1 is None: p1 = self.tip()

266

if p1 is None: p1 = self.tip()

267

if p2 is None: p2 = nullid

267

if p2 is None: p2 = nullid

268

269

node = hash(text, p1, p2)

269

node = hash(text, p1, p2)

270

271

if node in self.nodemap:

271

if node in self.nodemap:

272

return node

272

return node

273

274

n = self.count()

274

n = self.count()

275

t = n - 1

275

t = n - 1

276

277

if n:

277

if n:

278

base = self.base(t)

278

base = self.base(t)

279

start = self.start(base)

279

start = self.start(base)

280

end = self.end(t)

280

end = self.end(t)

281

prev = self.revision(self.tip())

281

prev = self.revision(self.tip())

282

d = self.diff(prev, text)

282

d = self.diff(prev, text)

283

data = compress(d)

283

data = compress(d)

284

dist = end - start + len(data)

284

dist = end - start + len(data)

285

286

# full versions are inserted when the needed deltas

286

# full versions are inserted when the needed deltas

287

# become comparable to the uncompressed text

287

# become comparable to the uncompressed text

288

if not n or dist > len(text) * 2:

288

if not n or dist > len(text) * 2:

289

data = compress(text)

289

data = compress(text)

290

base = n

290

base = n

291

else:

291

else:

292

base = self.base(t)

292

base = self.base(t)

293

294

offset = 0

294

offset = 0

295

if t >= 0:

295

if t >= 0:

296

offset = self.end(t)

296

offset = self.end(t)

297

298

e = (offset, len(data), base, link, p1, p2, node)

298

e = (offset, len(data), base, link, p1, p2, node)

299

300

self.index.append(e)

300

self.index.append(e)

301

self.nodemap[node] = n

301

self.nodemap[node] = n

302

entry = struct.pack(indexformat, *e)

302

entry = struct.pack(indexformat, *e)

303

304

transaction.add(self.datafile, e[0])

304

transaction.add(self.datafile, e[0])

305

self.opener(self.datafile, "a").write(data)

305

self.opener(self.datafile, "a").write(data)

306

transaction.add(self.indexfile, n * len(entry))

306

transaction.add(self.indexfile, n * len(entry))

307

self.opener(self.indexfile, "a").write(entry)

307

self.opener(self.indexfile, "a").write(entry)

308

309

self.cache = (node, n, text)

309

self.cache = (node, n, text)

310

return node

310

return node

311

312

def ancestor(self, a, b):

312

def ancestor(self, a, b):

313

# calculate the distance of every node from root

313

# calculate the distance of every node from root

314

dist = {nullid: 0}

314

dist = {nullid: 0}

315

for i in xrange(self.count()):

315

for i in xrange(self.count()):

316

n = self.node(i)

316

n = self.node(i)

317

p1, p2 = self.parents(n)

317

p1, p2 = self.parents(n)

318

dist[n] = max(dist[p1], dist[p2]) + 1

318

dist[n] = max(dist[p1], dist[p2]) + 1

319

320

# traverse ancestors in order of decreasing distance from root

320

# traverse ancestors in order of decreasing distance from root

321

def ancestors(node):

321

def ancestors(node):

322

# we store negative distances because heap returns smallest member

322

# we store negative distances because heap returns smallest member

323

h = [(-dist[node], node)]

323

h = [(-dist[node], node)]

324

seen = {}

324

seen = {}

325

earliest = self.count()

325

earliest = self.count()

326

while h:

326

while h:

327

d, n = heapq.heappop(h)

327

d, n = heapq.heappop(h)

328

r = self.rev(n)

328

r = self.rev(n)

329

if n not in seen:

329

if n not in seen:

330

seen[n] = 1

330

seen[n] = 1

331

yield (-d, n)

331

yield (-d, n)

332

for p in self.parents(n):

332

for p in self.parents(n):

333

heapq.heappush(h, (-dist[p], p))

333

heapq.heappush(h, (-dist[p], p))

334

335

x = ancestors(a)

335

x = ancestors(a)

336

y = ancestors(b)

336

y = ancestors(b)

337

lx = x.next()

337

lx = x.next()

338

ly = y.next()

338

ly = y.next()

339

340

# increment each ancestor list until it is closer to root than

340

# increment each ancestor list until it is closer to root than

341

# the other, or they match

341

# the other, or they match

342

while 1:

342

while 1:

343

if lx == ly:

343

if lx == ly:

344

return lx[1]

344

return lx[1]

345

elif lx < ly:

345

elif lx < ly:

346

ly = y.next()

346

ly = y.next()

347

elif lx > ly:

347

elif lx > ly:

348

lx = x.next()

348

lx = x.next()

349

350

def group(self, linkmap):

350

def group(self, linkmap):

351

# given a list of changeset revs, return a set of deltas and

351

# given a list of changeset revs, return a set of deltas and

352

# metadata corresponding to nodes. the first delta is

352

# metadata corresponding to nodes. the first delta is

353

# parent(nodes[0]) -> nodes[0] the receiver is guaranteed to

353

# parent(nodes[0]) -> nodes[0] the receiver is guaranteed to

354

# have this parent as it has all history before these

354

# have this parent as it has all history before these

355

# changesets. parent is parent[0]

355

# changesets. parent is parent[0]

356

357

revs = []

357

revs = []

358

needed = {}

358

needed = {}

359

360

# find file nodes/revs that match changeset revs

360

# find file nodes/revs that match changeset revs

361

for i in xrange(0, self.count()):

361

for i in xrange(0, self.count()):

362

if self.index[i][3] in linkmap:

362

if self.index[i][3] in linkmap:

363

revs.append(i)

363

revs.append(i)

364

needed[i] = 1

364

needed[i] = 1

365

366

# if we don't have any revisions touched by these changesets, bail

366

# if we don't have any revisions touched by these changesets, bail

367

if not revs:

367

if not revs:

368

yield struct.pack(">l", 0)

368

yield struct.pack(">l", 0)

369

return

369

return

370

371

# add the parent of the first rev

371

# add the parent of the first rev

372

p = self.parents(self.node(revs[0]))[0]

372

p = self.parents(self.node(revs[0]))[0]

373

revs.insert(0, self.rev(p))

373

revs.insert(0, self.rev(p))

374

375

# for each delta that isn't contiguous in the log, we need to

375

# for each delta that isn't contiguous in the log, we need to

376

# reconstruct the base, reconstruct the result, and then

376

# reconstruct the base, reconstruct the result, and then

377

# calculate the delta. We also need to do this where we've

377

# calculate the delta. We also need to do this where we've

378

# stored a full version and not a delta

378

# stored a full version and not a delta

379

for i in xrange(0, len(revs) - 1):

379

for i in xrange(0, len(revs) - 1):

380

a, b = revs[i], revs[i + 1]

380

a, b = revs[i], revs[i + 1]

381

if a + 1 != b or self.base(b) == b:

381

if a + 1 != b or self.base(b) == b:

382

for j in xrange(self.base(a), a + 1):

382

for j in xrange(self.base(a), a + 1):

383

needed[j] = 1

383

needed[j] = 1

384

for j in xrange(self.base(b), b + 1):

384

for j in xrange(self.base(b), b + 1):

385

needed[j] = 1

385

needed[j] = 1

386

387

# calculate spans to retrieve from datafile

387

# calculate spans to retrieve from datafile

388

needed = needed.keys()

388

needed = needed.keys()

389

needed.sort()

389

needed.sort()

390

spans = []

390

spans = []

391

oo = -1

391

oo = -1

392

ol = 0

392

ol = 0

393

for n in needed:

393

for n in needed:

394

if n < 0: continue

394

if n < 0: continue

395

o = self.start(n)

395

o = self.start(n)

396

l = self.length(n)

396

l = self.length(n)

397

if oo + ol == o: # can we merge with the previous?

397

if oo + ol == o: # can we merge with the previous?

398

nl = spans[-1][2]

398

nl = spans[-1][2]

399

nl.append((n, l))

399

nl.append((n, l))

400

ol += l

400

ol += l

401

spans[-1] = (oo, ol, nl)

401

spans[-1] = (oo, ol, nl)

402

else:

402

else:

403

oo = o

403

oo = o

404

ol = l

404

ol = l

405

spans.append((oo, ol, [(n, l)]))

405

spans.append((oo, ol, [(n, l)]))

406

407

# read spans in, divide up chunks

407

# read spans in, divide up chunks

408

chunks = {}

408

chunks = {}

409

for span in spans:

409

for span in spans:

410

# we reopen the file for each span to make http happy for now

410

# we reopen the file for each span to make http happy for now

411

f = self.opener(self.datafile)

411

f = self.opener(self.datafile)

412

f.seek(span[0])

412

f.seek(span[0])

413

data = f.read(span[1])

413

data = f.read(span[1])

414

415

# divide up the span

415

# divide up the span

416

pos = 0

416

pos = 0

417

for r, l in span[2]:

417

for r, l in span[2]:

418

chunks[r] = decompress(data[pos: pos + l])

418

chunks[r] = decompress(data[pos: pos + l])

419

pos += l

419

pos += l

420

421

# helper to reconstruct intermediate versions

421

# helper to reconstruct intermediate versions

422

def construct(text, base, rev):

422

def construct(text, base, rev):

423

bins = [chunks[r] for r in xrange(base + 1, rev + 1)]

423

bins = [chunks[r] for r in xrange(base + 1, rev + 1)]

424

return mdiff.patches(text, bins)

424

return mdiff.patches(text, bins)

425

426

# build deltas

426

# build deltas

427

deltas = []

427

deltas = []

428

for d in xrange(0, len(revs) - 1):

428

for d in xrange(0, len(revs) - 1):

429

a, b = revs[d], revs[d + 1]

429

a, b = revs[d], revs[d + 1]

430

n = self.node(b)

430

n = self.node(b)

431

432

# do we need to construct a new delta?

432

# do we need to construct a new delta?

433

if a + 1 != b or self.base(b) == b:

433

if a + 1 != b or self.base(b) == b:

434

if a >= 0:

434

if a >= 0:

435

base = self.base(a)

435

base = self.base(a)

436

ta = chunks[self.base(a)]

436

ta = chunks[self.base(a)]

437

ta = construct(ta, base, a)

437

ta = construct(ta, base, a)

438

else:

438

else:

439

ta = ""

439

ta = ""

440

441

base = self.base(b)

441

base = self.base(b)

442

if a > base:

442

if a > base:

443

base = a

443

base = a

444

tb = ta

444

tb = ta

445

else:

445

else:

446

tb = chunks[self.base(b)]

446

tb = chunks[self.base(b)]

447

tb = construct(tb, base, b)

447

tb = construct(tb, base, b)

448

d = self.diff(ta, tb)

448

d = self.diff(ta, tb)

449

else:

449

else:

450

d = chunks[b]

450

d = chunks[b]

451

452

p = self.parents(n)

452

p = self.parents(n)

453

meta = n + p[0] + p[1] + linkmap[self.linkrev(n)]

453

meta = n + p[0] + p[1] + linkmap[self.linkrev(n)]

454

l = struct.pack(">l", len(meta) + len(d) + 4)

454

l = struct.pack(">l", len(meta) + len(d) + 4)

455

yield l

455

yield l

456

yield meta

456

yield meta

457

yield d

457

yield d

458

459

yield struct.pack(">l", 0)

459

yield struct.pack(">l", 0)

460

461

def addgroup(self, revs, linkmapper, transaction, unique = 0):

461

def addgroup(self, revs, linkmapper, transaction, unique = 0):

462

# given a set of deltas, add them to the revision log. the

462

# given a set of deltas, add them to the revision log. the

463

# first delta is against its parent, which should be in our

463

# first delta is against its parent, which should be in our

464

# log, the rest are against the previous delta.

464

# log, the rest are against the previous delta.

465

466

# track the base of the current delta log

466

# track the base of the current delta log

467

r = self.count()

467

r = self.count()

468

t = r - 1

468

t = r - 1

469

node = nullid

469

node = nullid

470

471

base = prev = -1

471

base = prev = -1

472

start = end = 0

472

start = end = 0

473

if r:

473

if r:

474

start = self.start(self.base(t))

474

start = self.start(self.base(t))

475

end = self.end(t)

475

end = self.end(t)

476

measure = self.length(self.base(t))

476

measure = self.length(self.base(t))

477

base = self.base(t)

477

base = self.base(t)

478

prev = self.tip()

478

prev = self.tip()

479

480

transaction.add(self.datafile, end)

480

transaction.add(self.datafile, end)

481

transaction.add(self.indexfile, r * struct.calcsize(indexformat))

481

transaction.add(self.indexfile, r * struct.calcsize(indexformat))

482

dfh = self.opener(self.datafile, "a")

482

dfh = self.opener(self.datafile, "a")

483

ifh = self.opener(self.indexfile, "a")

483

ifh = self.opener(self.indexfile, "a")

484

485

# loop through our set of deltas

485

# loop through our set of deltas

486

chain = None

486

chain = None

487

for chunk in revs:

487

for chunk in revs:

488

node, p1, p2, cs = struct.unpack("20s20s20s20s", chunk[:80])

488

node, p1, p2, cs = struct.unpack("20s20s20s20s", chunk[:80])

489

link = linkmapper(cs)

489

link = linkmapper(cs)

490

if node in self.nodemap:

490

if node in self.nodemap:

491

# this can happen if two branches make the same change

491

# this can happen if two branches make the same change

492

if unique:

492

if unique:

493

raise "already have %s" % hex(node[:4])

493

raise "already have %s" % hex(node[:4])

494

continue

494

continue

495

delta = chunk[80:]

495

delta = chunk[80:]

496

497

if not chain:

497

if not chain:

498

# retrieve the parent revision of the delta chain

498

# retrieve the parent revision of the delta chain

499

chain = p1

499

chain = p1

500

if not chain in self.nodemap:

500

if not chain in self.nodemap:

501

raise "unknown base %s" % short(chain[:4])

501

raise "unknown base %s" % short(chain[:4])

502

503

# full versions are inserted when the needed deltas become

503

# full versions are inserted when the needed deltas become

504

# comparable to the uncompressed text or when the previous

504

# comparable to the uncompressed text or when the previous

505

# version is not the one we have a delta against. We use

505

# version is not the one we have a delta against. We use

506

# the size of the previous full rev as a proxy for the

506

# the size of the previous full rev as a proxy for the

507

# current size.

507

# current size.

508

509

if chain == prev:

509

if chain == prev:

510

cdelta = compress(delta)

510

cdelta = compress(delta)

511

512

if chain != prev or (end - start + len(cdelta)) > measure * 2:

512

if chain != prev or (end - start + len(cdelta)) > measure * 2:

513

# flush our writes here so we can read it in revision

513

# flush our writes here so we can read it in revision

514

dfh.flush()

514

dfh.flush()

515

ifh.flush()

515

ifh.flush()

516

text = self.revision(chain)

516

text = self.revision(chain)

517

text = self.patches(text, [delta])

517

text = self.patches(text, [delta])

518

chk = self.addrevision(text, transaction, link, p1, p2)

518

chk = self.addrevision(text, transaction, link, p1, p2)

519

if chk != node:

519

if chk != node:

520

raise "consistency error adding group"

520

raise "consistency error adding group"

521

measure = len(text)

521

measure = len(text)

522

else:

522

else:

523

e = (end, len(cdelta), self.base(t), link, p1, p2, node)

523

e = (end, len(cdelta), self.base(t), link, p1, p2, node)

524

self.index.append(e)

524

self.index.append(e)

525

self.nodemap[node] = r

525

self.nodemap[node] = r

526

dfh.write(cdelta)

526

dfh.write(cdelta)

527

ifh.write(struct.pack(indexformat, *e))

527

ifh.write(struct.pack(indexformat, *e))

528

529

t, r, chain, prev = r, r + 1, node, node

529

t, r, chain, prev = r, r + 1, node, node

530

start = self.start(self.base(t))

530

start = self.start(self.base(t))

531

end = self.end(t)

531

end = self.end(t)

532

533

dfh.close()

533

dfh.close()

534

ifh.close()

534

ifh.close()

535

return node

535

return node

	Site-wide shortcuts
/	Use quick search box
g h	Goto home page
g g	Goto my private gists page
g G	Goto my public gists page
g 0-9	Goto bookmarked items from 0-9
n r	New repository page
n g	New gist page

	Repositories
g s	Goto summary page
g c	Goto changelog page
g f	Goto files page
g F	Goto files page with file search activated
g p	Goto pull requests page
g o	Goto repository settings
g O	Goto repository access permissions settings
t s	Toggle sidebar on some pages

             # revlog.py - storage back-end for mercurial
             #
             # This provides efficient delta storage with O(1) retrieve and append
             # and O(changes) merge between branches
             #
             # Copyright 2005 Matt Mackall <mpm@selenic.com>
             #
             # This software may be used and distributed according to the terms
             # of the GNU General Public License, incorporated herein by reference.
             import zlib, struct, sha, binascii, heapq
             from mercurial import mdiff
             def hex(node): return binascii.hexlify(node)
             def bin(node): return binascii.unhexlify(node)
-            def short(node): return hex(node[:4])
+            def short(node): return hex(node[:6])
             def compress(text):
                 if not text: return text
                 if len(text) < 44:
                     if text[0] == '\0': return text
                     return 'u' + text
                 bin = zlib.compress(text)
                 if len(bin) > len(text):
                     if text[0] == '\0': return text
                     return 'u' + text
                 return bin
             def decompress(bin):
                 if not bin: return bin
                 t = bin[0]
                 if t == '\0': return bin
                 if t == 'x': return zlib.decompress(bin)
                 if t == 'u': return bin[1:]
                 raise "unknown compression type %s" % t
             def hash(text, p1, p2):
                 l = [p1, p2]
                 l.sort()
                 return sha.sha(l[0] + l[1] + text).digest()
             nullid = "\0" * 20
             indexformat = ">4l20s20s20s"
             class lazyparser:
                 def __init__(self, data, revlog):
                     self.data = data
                     self.s = struct.calcsize(indexformat)
                     self.l = len(data)/self.s
                     self.index = [None] * self.l
                     self.map = {nullid: -1}
                     self.all = 0
                     self.revlog = revlog
                 def load(self, pos=None):
                     if self.all: return
                     if pos is not None:
                         block = pos / 1000
                         i = block * 1000
                         end = min(self.l, i + 1000)
                     else:
                         self.all = 1
                         i = 0
                         end = self.l
                         self.revlog.index = self.index
                         self.revlog.nodemap = self.map
                     while i < end:
                         d = self.data[i * self.s: (i + 1) * self.s]
                         e = struct.unpack(indexformat, d)
                         self.index[i] = e
                         self.map[e[6]] = i
                         i += 1
             class lazyindex:
                 def __init__(self, parser):
                     self.p = parser
                 def __len__(self):
                     return len(self.p.index)
                 def load(self, pos):
                     self.p.load(pos)
                     return self.p.index[pos]
                 def __getitem__(self, pos):
                     return self.p.index[pos] or self.load(pos)
                 def append(self, e):
                     self.p.index.append(e)
             class lazymap:
                 def __init__(self, parser):
                     self.p = parser
                 def load(self, key):
                     if self.p.all: return
                     n = self.p.data.find(key)
                     if n < 0: raise KeyError("node " + hex(key))
                     pos = n / self.p.s
                     self.p.load(pos)
                 def __contains__(self, key):
                     self.p.load()
                     return key in self.p.map
                 def __iter__(self):
                     for i in xrange(self.p.l):
                         try:
                             yield self.p.index[i][6]
                         except:
                             self.p.load(i)
                             yield self.p.index[i][6]
                 def __getitem__(self, key):
                     try:
                         return self.p.map[key]
                     except KeyError:
                         try:
                             self.load(key)
                             return self.p.map[key]
                         except KeyError:
                             raise KeyError("node " + hex(key))
                 def __setitem__(self, key, val):
                     self.p.map[key] = val
             class revlog:
                 def __init__(self, opener, indexfile, datafile):
                     self.indexfile = indexfile
                     self.datafile = datafile
                     self.opener = opener
                     self.cache = None
                     try:
                         i = self.opener(self.indexfile).read()
                     except IOError:
                         i = ""
                     if len(i) > 10000:
                         # big index, let's parse it on demand
                         parser = lazyparser(i, self)
                         self.index = lazyindex(parser)
                         self.nodemap = lazymap(parser)
                     else:
                         s = struct.calcsize(indexformat)
                         l = len(i) / s
                         self.index = [None] * l
                         m = [None] * l
                         n = 0
                         for f in xrange(0, len(i), s):
                             # offset, size, base, linkrev, p1, p2, nodeid
                             e = struct.unpack(indexformat, i[f:f + s])
                             m[n] = (e[6], n)
                             self.index[n] = e
                             n += 1
                         self.nodemap = dict(m)
                         self.nodemap[nullid] = -1
                 def tip(self): return self.node(len(self.index) - 1)
                 def count(self): return len(self.index)
                 def node(self, rev): return (rev < 0) and nullid or self.index[rev][6]
                 def rev(self, node): return self.nodemap[node]
                 def linkrev(self, node): return self.index[self.nodemap[node]][3]
                 def parents(self, node):
                     if node == nullid: return (nullid, nullid)
                     return self.index[self.nodemap[node]][4:6]
                 def start(self, rev): return self.index[rev][0]
                 def length(self, rev): return self.index[rev][1]
                 def end(self, rev): return self.start(rev) + self.length(rev)
                 def base(self, rev): return self.index[rev][2]
                 def heads(self):
                     p = {}
                     h = []
                     for r in range(self.count() - 1, -1, -1):
                         n = self.node(r)
                         if n not in p:
                             h.append(n)
                         for pn in self.parents(n):
                             p[pn] = 1
                     return h
                 def children(self, node):
                     c = []
                     p = self.rev(node)
                     for r in range(p + 1, self.count()):
                         n = self.node(r)
                         for pn in self.parents(n):
                             if pn == p:
                                 c.append(p)
                                 continue
                             elif pn == nullid:
                                 continue
                     return c
                 def lookup(self, id):
                     try:
                         rev = int(id)
                         return self.node(rev)
                     except ValueError:
                         c = []
                         for n in self.nodemap:
                             if id in hex(n):
                                 c.append(n)
                         if len(c) > 1: raise KeyError("Ambiguous identifier")
                         if len(c) < 1: raise KeyError("No match found")
                         return c[0]
                     return None
                 def diff(self, a, b):
                     return mdiff.textdiff(a, b)
                 def patches(self, t, pl):
                     return mdiff.patches(t, pl)
                 def delta(self, node):
                     r = self.rev(node)
                     b = self.base(r)
                     if r == b:
                         return self.diff(self.revision(self.node(r - 1)),
                                          self.revision(node))
                     else:
                         f = self.opener(self.datafile)
                         f.seek(self.start(r))
                         data = f.read(self.length(r))
                     return decompress(data)
                 def revision(self, node):
                     if node == nullid: return ""
                     if self.cache and self.cache[0] == node: return self.cache[2]
                     text = None
                     rev = self.rev(node)
                     start, length, base, link, p1, p2, node = self.index[rev]
                     end = start + length
                     if base != rev: start = self.start(base)
                     if self.cache and self.cache[1] >= base and self.cache[1] < rev:
                         base = self.cache[1]
                         start = self.start(base + 1)
                         text = self.cache[2]
                         last = 0
                     f = self.opener(self.datafile)
                     f.seek(start)
                     data = f.read(end - start)
                     if not text:
                         last = self.length(base)
                         text = decompress(data[:last])
                     bins = []
                     for r in xrange(base + 1, rev + 1):
                         s = self.length(r)
                         bins.append(decompress(data[last:last + s]))
                         last = last + s
                     text = mdiff.patches(text, bins)
                     if node != hash(text, p1, p2):
                         raise IOError("integrity check failed on %s:%d"
                                       % (self.datafile, rev))
                     self.cache = (node, rev, text)
                     return text
                 def addrevision(self, text, transaction, link, p1=None, p2=None):
                     if text is None: text = ""
                     if p1 is None: p1 = self.tip()
                     if p2 is None: p2 = nullid
                     node = hash(text, p1, p2)
                     if node in self.nodemap:
                         return node
                     n = self.count()
                     t = n - 1
                     if n:
                         base = self.base(t)
                         start = self.start(base)
                         end = self.end(t)
                         prev = self.revision(self.tip())
                         d = self.diff(prev, text)
                         data = compress(d)
                         dist = end - start + len(data)
                     # full versions are inserted when the needed deltas
                     # become comparable to the uncompressed text
                     if not n or dist > len(text) * 2:
                         data = compress(text)
                         base = n
                     else:
                         base = self.base(t)
                     offset = 0
                     if t >= 0:
                         offset = self.end(t)
                     e = (offset, len(data), base, link, p1, p2, node)
                     self.index.append(e)
                     self.nodemap[node] = n
                     entry = struct.pack(indexformat, *e)
                     transaction.add(self.datafile, e[0])
                     self.opener(self.datafile, "a").write(data)
                     transaction.add(self.indexfile, n * len(entry))
                     self.opener(self.indexfile, "a").write(entry)
                     self.cache = (node, n, text)
                     return node
                 def ancestor(self, a, b):
                     # calculate the distance of every node from root
                     dist = {nullid: 0}
                     for i in xrange(self.count()):
                         n = self.node(i)
                         p1, p2 = self.parents(n)
                         dist[n] = max(dist[p1], dist[p2]) + 1
                     # traverse ancestors in order of decreasing distance from root
                     def ancestors(node):
                         # we store negative distances because heap returns smallest member
                         h = [(-dist[node], node)]
                         seen = {}
                         earliest = self.count()
                         while h:
                             d, n = heapq.heappop(h)
                             r = self.rev(n)
                             if n not in seen:
                                 seen[n] = 1
                                 yield (-d, n)
                                 for p in self.parents(n):
                                     heapq.heappush(h, (-dist[p], p))
                     x = ancestors(a)
                     y = ancestors(b)
                     lx = x.next()
                     ly = y.next()
                     # increment each ancestor list until it is closer to root than
                     # the other, or they match
                     while 1:
                         if lx == ly:
                             return lx[1]
                         elif lx < ly:
                             ly = y.next()
                         elif lx > ly:
                             lx = x.next()
                 def group(self, linkmap):
                     # given a list of changeset revs, return a set of deltas and
                     # metadata corresponding to nodes. the first delta is
                     # parent(nodes[0]) -> nodes[0] the receiver is guaranteed to
                     # have this parent as it has all history before these
                     # changesets. parent is parent[0]
                     revs = []
                     needed = {}
                     # find file nodes/revs that match changeset revs
                     for i in xrange(0, self.count()):
                         if self.index[i][3] in linkmap:
                             revs.append(i)
                             needed[i] = 1
                     # if we don't have any revisions touched by these changesets, bail
                     if not revs:
                         yield struct.pack(">l", 0)
                         return
                     # add the parent of the first rev
                     p = self.parents(self.node(revs[0]))[0]
                     revs.insert(0, self.rev(p))
                     # for each delta that isn't contiguous in the log, we need to
                     # reconstruct the base, reconstruct the result, and then
                     # calculate the delta. We also need to do this where we've
                     # stored a full version and not a delta
                     for i in xrange(0, len(revs) - 1):
                         a, b = revs[i], revs[i + 1]
                         if a + 1 != b or self.base(b) == b:
                             for j in xrange(self.base(a), a + 1):
                                 needed[j] = 1
                             for j in xrange(self.base(b), b + 1):
                                 needed[j] = 1
                     # calculate spans to retrieve from datafile
                     needed = needed.keys()
                     needed.sort()
                     spans = []
                     oo = -1
                     ol = 0
                     for n in needed:
                         if n < 0: continue
                         o = self.start(n)
                         l = self.length(n)
                         if oo + ol == o: # can we merge with the previous?
                             nl = spans[-1][2]
                             nl.append((n, l))
                             ol += l
                             spans[-1] = (oo, ol, nl)
                         else:
                             oo = o
                             ol = l
                             spans.append((oo, ol, [(n, l)]))
                     # read spans in, divide up chunks
                     chunks = {}
                     for span in spans:
                         # we reopen the file for each span to make http happy for now
                         f = self.opener(self.datafile)
                         f.seek(span[0])
                         data = f.read(span[1])
                         # divide up the span
                         pos = 0
                         for r, l in span[2]:
                             chunks[r] = decompress(data[pos: pos + l])
                             pos += l
                     # helper to reconstruct intermediate versions
                     def construct(text, base, rev):
                         bins = [chunks[r] for r in xrange(base + 1, rev + 1)]
                         return mdiff.patches(text, bins)
                     # build deltas
                     deltas = []
                     for d in xrange(0, len(revs) - 1):
                         a, b = revs[d], revs[d + 1]
                         n = self.node(b)
                         # do we need to construct a new delta?
                         if a + 1 != b or self.base(b) == b:
                             if a >= 0:
                                 base = self.base(a)
                                 ta = chunks[self.base(a)]
                                 ta = construct(ta, base, a)
                             else:
                                 ta = ""
                             base = self.base(b)
                             if a > base:
                                 base = a
                                 tb = ta
                             else:
                                 tb = chunks[self.base(b)]
                             tb = construct(tb, base, b)
                             d = self.diff(ta, tb)
                         else:
                             d = chunks[b]
                         p = self.parents(n)
                         meta = n + p[0] + p[1] + linkmap[self.linkrev(n)]
                         l = struct.pack(">l", len(meta) + len(d) + 4)
                         yield l
                         yield meta
                         yield d
                     yield struct.pack(">l", 0)
                 def addgroup(self, revs, linkmapper, transaction, unique = 0):
                     # given a set of deltas, add them to the revision log. the
                     # first delta is against its parent, which should be in our
                     # log, the rest are against the previous delta.
                     # track the base of the current delta log
                     r = self.count()
                     t = r - 1
                     node = nullid
                     base = prev = -1
                     start = end = 0
                     if r:
                         start = self.start(self.base(t))
                         end = self.end(t)
                         measure = self.length(self.base(t))
                         base = self.base(t)
                         prev = self.tip()
                     transaction.add(self.datafile, end)
                     transaction.add(self.indexfile, r * struct.calcsize(indexformat))
                     dfh = self.opener(self.datafile, "a")
                     ifh = self.opener(self.indexfile, "a")
                     # loop through our set of deltas
                     chain = None
                     for chunk in revs:
                         node, p1, p2, cs = struct.unpack("20s20s20s20s", chunk[:80])
                         link = linkmapper(cs)
                         if node in self.nodemap:
                             # this can happen if two branches make the same change
                             if unique:
                                 raise "already have %s" % hex(node[:4])
                             continue
                         delta = chunk[80:]
                         if not chain:
                             # retrieve the parent revision of the delta chain
                             chain = p1
                             if not chain in self.nodemap:
                                 raise "unknown base %s" % short(chain[:4])
                         # full versions are inserted when the needed deltas become
                         # comparable to the uncompressed text or when the previous
                         # version is not the one we have a delta against. We use
                         # the size of the previous full rev as a proxy for the
                         # current size.
                         if chain == prev:
                             cdelta = compress(delta)
                         if chain != prev or (end - start + len(cdelta)) > measure * 2:
                             # flush our writes here so we can read it in revision
                             dfh.flush()
                             ifh.flush()
                             text = self.revision(chain)
                             text = self.patches(text, [delta])
                             chk = self.addrevision(text, transaction, link, p1, p2)
                             if chk != node:
                                 raise "consistency error adding group"
                             measure = len(text)
                         else:
                             e = (end, len(cdelta), self.base(t), link, p1, p2, node)
                             self.index.append(e)
                             self.nodemap[node] = r
                             dfh.write(cdelta)
                             ifh.write(struct.pack(indexformat, *e))
                         t, r, chain, prev = r, r + 1, node, node
                         start = self.start(self.base(t))
                         end = self.end(t)
                     dfh.close()
                     ifh.close()
                     return node